面对面:评价视觉比较(Face to Face: Evaluating Visual Comparison)

比较两组数据是常见的任务。现有的对不同比较方法的评估往往基于直觉推理,而缺少可量化的测量手段。这篇工作通过一系列的实验,让用户在不同的比较排布形式下完成指定的比较任务(例如比较两组数据中哪一项的变化最大),从而实现了对各种排布形式效果的测量。

比较排布形式

在实验中,一共测试了五种比较排布形式,如图1所示:

图1. 不同的比较排布形式

垂直相邻(Stacked):将两组数据的可视化图表垂直地放置在相邻的位置。

水平相邻(Adjacent):将两组数据的可视化图表水平地放置在相邻的位置。

镜像(Mirrored):基于水平相邻的方式,将其中一组数据的可视化图表沿垂直对称轴做镜像操作。作者猜想,人类视觉系统对于对称的敏感可能有助于比较任务的完成。

重叠(Overlaid):将两组数据的可视化图表结合起来,相同的数据维度紧邻放置。根据以往的工作,重叠的排布方式可以减轻眼动和记忆负担,作者预计重叠式具有最佳的性能。

动画(Animated):在这种排布方式中,只展示一个图表,随着时间的推移,图表对应的数据将会从一组过渡到另一组,即通过动画的形式来表现两组数据的差异。

任务

作者一共设计了两个任务,如图2所示:

图2. 实验中的任务

最大差异任务(Maximum delta task):给出两组数据,实验的参与者需要比较两组数据,指出哪一数据项(或者称之为哪一维度)的数据发生了最大的改变。这里的改变是指绝对的变化,而不是相对的变化。

相关性任务(Correlation task):给出两对数据,每一对都包含两组数据,实验者需要指出哪一对中两组数据的相关性更大。

图表

对于最大差异任务,实验中一共使用了三种类型的图表:条形图(Bar chart),利用条形的长度表示数据的大小,在该实验中,每个条形图有7个数据项;斜率图(Slope chart),利用斜率的大小表示数据的大小,在该实验中,每个斜率图有3个数据项;甜甜圈图(Donut chart),利用圆环中所占的角度大小表示数据的大小,在该实验中,每个甜甜圈图中有4个数据项。由于甜甜圈图是径向分布的图表,垂直相邻和水平相邻这两种排布方式是等效的,因此,作者只测试了水平相邻的甜甜圈图,而没有测试垂直相邻的甜甜圈图。对于镜像的排布形式,每组数据的对应的甜甜圈被修改为一个半圆,使得两组数据的甜甜圈图能够对称。而在相关性任务中,只测试了条形图。

测量方法

图3. 测量方法

在实验中,作者使用了基于准确度的测量,而不是基于用户完成任务所需要的时间,作者认为参与者的反应时间可能会有大量的噪声。实验中采用了梯级效价方法(Titer staircase method)测量被试在不同情况下的表现,如图3所示。效价(Titer)是一个介于0到1之间的数值,用来控制任务的难度,效价越大,任务的难度越低。当参与者进行了一次成功的试验,效价会降低0.1,即难度提升;当参与者进行了一次失败的试验,效价会提升0.3,即任务的难度会降低,并且降低幅度等同于三次成功试验增加的难度的幅度。取最后五次试验的平均效价作为参与者表现的指标以进行后续分析。

实验过程

对于每种任务、图表形式、排布方式的组合,每个被试进行20次试验。在最大差异任务中,静态图表和动画都只显示1.5秒,而在相关性任务中,由于静态图表的数量增加一倍,静态图表展示3秒,而动画依然只显示1.5秒,以使得动画速度与之前一致。显示时间过后,静态图表只保留一个图表,而动画保持不动,用户在图表对应的位置点击,从而提交答案。被试将会立即得到回答正确与否的反馈。

按照任务和图表的类型,一共分为了4个子实验,实验1A是条形图的最大差异任务实验,实验1B是斜率图的最大差异任务实验,实验1C是甜甜圈图的最大差异任务实验,实验2是条形图的相关性任务实验。每个子实验均邀请到了50个被试,一共有200个被试参与实验。

实验结果

实验结果如图4所示。

图4. 实验结果

在实验1A即条形图的最大差异任务实验中,动画具有最好的表现,参与者能够完成的任务难度最高;镜像比垂直或水平相邻放置的效果更好,但幅度有限;此外,在镜像和相邻放置的情况下,参与者的表现接近实验设定的下限,这意味着当前设定下任务的难度过高,参与者经常选择错误的选项,导致效价一直保持在最低难度附近,但在之后的实验中,均未出现这种情况。

在实验1B中,重叠的斜率图有着最好的效果,动画其次,而镜像、垂直相邻和水平相邻三种放置方式之间没有显著的差异。而在实验1C中,动画具有最好的表现。在实验2中,动画相对于其他方法没有明显优势,而镜像的排布方法具有最好的效果。

案例分析

图5. Krona

作者选择了Krona,一种层次数据可视化工具作为案例进行分析。Krona的界面如图5所示,界面是一层一层的圆环,在径向上,越靠近圆心,表示对应的项的层次越高,越靠近边缘,表示层次越低,在相同的角度上,外圈代表的项是内圈的子孙节点,角度的大小表示占比的多少。Krona本身具有动画的效果,除此之外,作者还添加了镜像和水平相邻放置的功能。作者邀请了两位相关领域的专家使用Krona,使用之后,他们认为动画效果使得变化格外明显,但动画也带来了一些不需要的移动;当需要探索和调查的时候,静态的视图会更加合适。

讨论

在最大差异任务的动态图表中,速度直接编码了变化的大小,这可能是动画具有很好的表现的原因之一。而在重叠式斜率图中,角度也直接编码了变化的大小,这也可能导致了重叠式在斜率图的最大差异任务中取得了最好的表现。

可以看出,动画在表现两个数据集之间的显著差异方面,具有很好的效果,在某些情况下甚至由于重叠的形式。但是,动画形式的可扩展性较差,当数据集个数变多时,动画会导致用户的记忆负担增加,另外,动画不能被打印出来,无法像静态图表一样方便地分发。除了动画,镜像形式的可扩展性也较差,通常只能用于两个数据集的比较。

该工作只对简单的、低层次的视觉比较任务进行了实验,而这些低层次的比较任务可能难以代表实际的、高层次的视觉比较任务。此外,该工作没有对两个以上数据集的比较、其他的图表形式、同一图表形式中不同的数据项数目进行实验。

总体来说,这篇工作使用了有效的方法,对不同的可视比较排列方式进行了量化评价。

[1] Brian Ondov, Nicole Jardine, Niklas Elmqvist and Steven Franconeri. “Face to Face: Evaluating Visual Comparison”. IEEE transactions on visualization and computer graphics, 2019.

评论关闭。