地图是展现空间数据的有效工具之一。人们常常用地区分布图(choropleth maps),在不同的地图单元中使用不同的颜色来表示不同的数据范围。图形推理是一门可以帮助人们发现以及解释地图中的空间模式的技术。Wickham等人的 line-up[2]使用零假设显著性检验的方法,让人们从一些通过零假设生成的“诱饵”的混合集找出由真实数据绘制的地图,来确定所发现的模式的可信性。
本文[1]采用的line-up的显著性检验的方式,采用了空间自相关性模拟取代之前的完全随机模型来作为零假设(如图1)。并且实施了n=361的众包实验来检测不同的空间自相关性和几何结构(不同单元之间的变化)的地区分布图之间的最小可视差just noticeable difference (JND)。结果显示人们对于空间自相关性的认知随着基线自相关结构和几何结构变化。这些结果可以帮人们构建地理空间数据的统计功效的视觉等效。本文帮助提高line-up的构建和理解地理空间图形推理的测试。

图1:两个line-up 地图测试,左边构建基于完全随机模型的零假设,右边基于空间自相关性模拟。
背景:
Moran‘s I 是表示空间自相关性的一个指数。类似皮尔逊系数,1代表完全的正向空间自相关,-1 代表完全的负向空间自相关。本文通过置换不同单元之间的属性值,并且对每次置换都计算一次I值,来获得不同Moran’s I 的分布。如下图2计算公式:i和j是不同空间单元;z代表测量属性,例如犯罪率。右边公式的分子是协方差。

图2:Moran’I 计算公式
Just Noticeable Difference (JND) 最小可视差是人们认知两个不同物体所需的最小不同点。JND大约等于可以被人们以75%以上的概率区分两地图差异的最小的Moran‘s I 差值。
随着地图变得更加规则,可视化的人造地图变得越来越逼真。因此我们想要调查地图的不规则性对区分不同自相关性地图的影响。不规则性有两个方式表达。最小邻接指数:每个单元与其最邻近的单元的平均距离除以平均的单元面积。以及变异系数:测量单元之间变量的差异等级。经过试验后我们发现变异系数更有代表性。作者在Moran’s I 的分布中找出规则(~0.4)和不规则的( ~1.2)的地图。为了比较他们从规格网格中生成地图。因此将有三种地图类型,如下图3所示:

图3:三种类型的地图
实验:
方法论:作者实现了一个楼梯进程的实验,使用Moran’s I 作为空间自相关性的一个测量。对于一个给定的地图对象,展现给测试者这个对象以及和它有不同Moran’s I 值的地图,让他们选择有更高的空间自相关性的地图。如果选择正确则缩小两地图之前的I差值,选择失败则扩大I值。有两个楼梯方法,向上和向下操作。向上即所选对象I值大于目标对象,反之是向下操作。JND大约等于可以被人们以75%以上的概率区分两地图差异的最小的I差值。
数据是使用的真实的人口分布数据来自Middle Super Output Areas。之后在亚马逊平台上进行了n=361的众包实验。实验结果如下图4,JND随着Moran’s I 指数的增加而减少,随着不规则性的增加而增加。

图4:实验结果
数据清理:
因为是在众包平台采集的数据,不是在控制实验环境下采集。数据在不同参与人之间存在误差:between-participant variation,有些人在实验过程中可能假装去猜测。再就是存在天花板效应。如图5所示。水平线代表给定地图对象的Moran’s I,黑色的点代表错误的判断,并且采用的向上操作。在基准I较大并且采用向上操作的时候,可以选择的不同I值太少,因此造成错误率增加。通过设置阙值和判断准确率的方式来进行数据清理。去掉超过设定阙值的不合理数据以及准确率过低(<0.55)的天花板效应数据。

图5:天花板效应
数据分析:
错误率是参与者错误的判断更相近的地图自相关性的数据所占比例。这类似与统计学中的统计功效。作者统计了所搜集的数据展示如下图6:紫色,橙色和绿色分别代表不规则地图,规则地图和规则的网格图。长度是不正确任务所占的比例,并且黑色的竖线代表了20%的错误率。可以发现自左向右随着Moran‘s I 的增加错误率在减少。自上而下随着Moran‘s I 差值的增加错误率也在增加。

图6:错误率分布
总结:
本文提供了实证对于提高line-up技术在地区分布图中的使用。采用了楼梯式设计的众包实验,并且发现JND随着Moran‘s I 和 地图不规则性的变化规律。测试的JND结果会对line-up测试结果的期望做出贡献。
Reference: [1] R. Beecham, J. Dykes, W. Meulemans, A. Slingsby, C. Turkay and J. Wood, “Map LineUps: Effects of spatial structure on graphical inference,” in IEEE Transactions on Visualization and Computer Graphics, vol. 23, no. 1, pp. 391-400, Jan. 2017.
[2] Wickham, Hadley, Dianne Cook, Heike Hofmann, and Andreas Buja. “Graphical inference for infovis.” IEEE Transactions on Visualization and Computer Graphics 16, no. 6 (2010): 973-979.
评论关闭。