多类散点图中平均值的感知(Perception of Average Value in Multiclass Scatterplots)

许多可视化任务都需要观察者在多组对象中建立视觉“抽象”或者统计性的总结。其中,我们将用户在一些对象的集合中感知聚集属性(aggregate properties)的过程叫做视觉聚集(visual aggregation),例如对不同类对象某些属性的区分。而另一方面,散点图(scatterplot)为我们提供了可以同时展示多个数据类用于相互之间比较的能力。因此,我们可以在散点图中对多个类的平均属性评估它们的差异,以探索人的视觉系统对多类散点图的感知特性,进而帮助更好地设计散点图。Michael等人就进行了一系列的user study实验,来探索人们对多类散点图中类平均值的感知[1]。

QQ截图20140512225804

图1 关于多类散点图的性能预测

实际上,前人在这方面已经做了一些相关的研究,只不过针对的只是比较简单的视觉展示,并且需要观察者快速做出反应。Michael等人的这篇文章[1]在这些方面做出了改进,用户面对的是更复杂的视觉展示,而且拥有足够的时间作出更为精确的判断。为了完成该实验,他们还进行了基于众包的实验,使用Amazon’s Mechanical Turk平台让用户可以通过web浏览器完成一系列的任务。

在介绍这一系列的实验之前,我们先引入介绍基于对多类散点图性能的7个预测(实际上,这也是实验的基础和所要验证的假设)。这7个预测以及对应的示意图分别解释如下:

预测1 类均值越接近,对性能的影响越大(图1a)
预测2 每个类中点的数量的增加不会影响性能(图1b)
预测3 好的视觉特征(如颜色)能够带来更好的性能(图1c)
预测4 冗余的视觉特征不会提升性能(图1d)
预测5 有冲突的视觉特征(非突出)不会影响性能(图1e)
预测6 额外增加不相关的类不会影响性能(图1f)
预测7 足够多的注意力干扰可能会影响性能

回到我们的实验中。本实验的任务是在多类散点图中对类的平均高度作出判断,也即是比较多个类的平均高度并给出高者。基于此,作者开展了一系列的试点研究(目的是为了对实验参数进行初步探索)和两个主要的实验集。对于多类散点图,其主要包含了几个属性。一是类的个数,由于实验中使用了双向比较,因此主要使用了两个类,在一些情况下额外增加一个类用于实验。第二是每个类中点的个数,除一些情况下用了75个点,其他都是以50个点作为基准。第三是类的互混度,也即是点的聚类程度。最主要的一个属性是“难度”,即每个类中点的均值之间的差异,使用Δ表示,如图2所示,不同的Δ会对判断的精确度造成不同程度的影响,这也是实验所要验证的假设之一。

222

图2 不同Δ的多类散点图展示

为了生成用于实验的多类散点图,作者使用了随机分布的方式布点,并保证两个类的竖直中心选在散点图中心三分之一的某处。对于点的视觉展示,则使用了实心圆或者其他形状,这在之后的实验中可以看到。接下来,基于上述这些预测,作者在他们的类均值比较实验中提出了一系列待确认或否决的假设,分别如下:

假设1 参数Δ对任务难度的度量具有正面的帮助
假设2 增加点的个数不会显著影响性能
假设3 颜色比其他视觉特征具有更好的性能
假设4 冗余的视觉特征不会对性能有显著的帮助
假设5 有冲突的(次要的)视觉特征不会影响性能
假设6 额外增加类不会影响性能
假设7 足够多的注意力干扰会影响性能

第一个实验集叫做between-subjects实验,用来初步探索视觉表示的参数空间和确认某些假设。该实验集共包含11个实验,分别给参与者展示了一个简单类型的多类散点图。如图3所示,共给出了三种视觉表示特征,包括颜色,形状和亮度。根据判断的正确与否,使用双向方差分析(two-way analysis of variance)计算得出精确度。在该实验中,我们可以看到实验j和k的精确度明显比其他的低,表明颜色确实是一种更为重要和显著的特征,这就验证了假设3。另外,根据对Δ和精确度之间关系的分析,可以得出随着Δ的增大,精确度也在增大,因此假设1得到验证。

4

图3 between-subjects实验的结果

第二个实验集叫做within-subjects实验,使用更强的模型来进一步验证其他假设,以及探索在某些更为特殊的类的视觉表示之间的相互关系。该实验集共有9个实验,每个参与者被展示两组不同的散点图集,一组包含比较简单的视觉特征,另一组包含更难更复杂的视觉特征。该实验的结果如图4所示,根据精确度的比较我们可以看出,实验d给假设2提供了更多的证据,结合实验g和h,假设4有了更高的说服力,而实验a,b,c,e,i联合证明了假设5。另外,分别根据实验a,e,f和实验a和e,我们可以看到假设6和7也有了一定的依据。通过这些分析,实验所提出的假设基本都有了一定的证据支持。

0

图4 within-subjects实验的结果

通过该实验,我们可以看到,观察者有能力对类属性的差异进行判断,并且同时使用多个视觉特征也可能是一个有效的策略,这些都进一步证明了多类散点图这方面的能力。另外,根据实验的分析结果,我们在今后对多类散点图的设计方面也可以有更科学的依据,从而设计出更好的散点图。

[1] Michael Gleicher, Michael Correll, Christine Nothelfer, and Steven Franconeri. Perception of Average Value in Multiclass Scatterplots. Visualization and Computer Graphics, IEEE Transactions on, 19(12), 2316-2325.

1 条评论。