保持多个视图一致:可视化构建中的约束、确认和例外(Keeping Multiple Views Consistent: Constraints, Validations, and Exceptions in Visualization Authoring)

可视化作者创建和展示可视化时,经常生成多个视图。多个视图之间可能存在不一致的现象:相同的变量可能在不同视图中以不同方式编码;不同的变量也可能以相同的方式编码。

已有的可视化设计的准则通常针对单视图可视化。对于多视图可视化,则需要可视化作者根据自己的准则做决定。关于可视化作者何时会遵循一致性,以及会遵循什么样的一致性,现在还很少有工作揭示。这篇论文[1]是第一个对此进行详细研究的工作。

一致性约束样例

一致性约束模型

这篇论文的作者从比例尺的角度定义一致性准则。比例尺(scale)是属性值域和视觉元素值范围的映射和逆映射。它由三部分组成:域(domain)、范围(range)和映射。域和范围的概念取自D3中的定义。域与一个数据属性相关联,范围则和映射资源有关。

一致性约束模型从2个高层次的约束出发。这2个约束是:

  • C1:相同属性⇒相同比例尺,即相同的属性按照相同的比例尺进行映射;
  • C2:不同属性⇒不同比例尺,即不同数据属性的映射不同。

作者对这2个高层次约束,从数据类型(数值型、标称型)和映射通道(XY,颜色)的组合出发,扩展成8个细节约束,再加上对常数颜色的约束,共得到9个细节约束。

下面介绍作者们关于9个细节约束进行的实验和结果。

实验

实验设置

Tableau是实验中被试使用的软件,因为它支持从探索到展示的迅速切换,并且提供灵活的多视图排列方式。

参与实验的被试是从大学的人机交互的邮件列表中选取,共有10名被试,其中4名男性,6名女性,年龄在18岁至56岁之间。他们都熟悉Tableau,并且至少在可视化方面有最基础的知识。

实验中,被试可以从多个数据集中选取最感兴趣的,以使实验条件更接近真实场景。

实验采取的范式为绿野仙踪范式(Wizard-of-Oz)。实验中实验者声称有一个自动工具对被试的可视化进行了检查,但实际这个工具并不存在。相反,实验者手动检查了一致性。这一范式在人机交互实验中较为常见,用于支持快速原型验证。

实验过程

实验分为4个阶段:

  • 第一阶段,会话(session)1,被试被要求使用Tableau可视探索所选数据集,并假想自己下一阶段将要展示他们的探索,但是在这一阶段他们可以专注于探索。实验采取有声思维报告法,被试一边探索,一边汇报思维过程。
  • 第二阶段,在会话1和会话2之间,实验者根据一致性约束模型检查了被试提交的可视化结果,以系统警告的形式记录。
  • 第三阶段,会话2,被试得到了“自动系统”对会话1创建的可视化的警告,经过认真的思考,决定是否遵循这些警告进行修改,如果遵循,则在更改过程中会继续收到系统警告,从而迭代完成修改;如果选择拒绝系统的警告,则需要给予理由。
  • 第四阶段,被试回答4个关于系统所给的警告和自动工具在哪些方面有助于探索和展示的问题。

定义:确认和例外

为了分析对于一致性约束,用户是接受还是拒绝,该论文的作者们定义了确认和例外以及计数方法。

确认是指用户自发遵守或者在收到警告后遵守一致性约束,例外是指用户给予明确的理由拒绝遵守一致性约束。确认和例外的计数方式是,如果被试遵守约束条件,他需要更改或验证比例尺的次数。例如,当用户保持两个视图中的y比例尺一致时,记2次确认。

实验结果

数值型XY比例尺
C1.1 相同属性⇒相同XY比例尺

对于域相同,要求坐标轴有相同的最大最小值;对于范围,要求坐标轴有相同的长度;对于映射函数,要求映射类型相同,如同为线性映射、对数映射等

确认(28)

一些用户手动设置不同视图中y轴范围和长度相同,以进行比较。当域的范围相差较小时,有用户在经过警告后立即修改可视化以符合一致性约束。

例外(15)

当不同视图的坐标轴没有并列时,一些用户认为由于目标不是进行比较,所以不需要遵守一致性约束。

例外(18)

18个例外的原因是,如果遵守一致性约束条件,会导致视图中的空白区域过多。

C2.1 不同属性⇒不同XY比例尺的域

对于不同的属性,这一约束一般会自动得到遵守,除非不同属性碰巧拥有相同的值域,例如,概率的取值范围都是[0,1]。轴的长度以及比例尺的映射方式可以相同或者不同。

确认(10)

作者们只包括了经过思索之后的确认。一位被试对不同的属性,对百分比的数据使用线性映射,而其它属性则选择对数映射。

实验中这一约束没有例外情况。

标称型XY比例尺
C1.2 相同属性⇒相同数值,且顺序相同

这一约束要求比例尺拥有相同的数据域,即,相同的标称值;相同的视觉范围,即相同的坐标轴长度;以及相同的映射方式,即,相同的标称值的顺序一致。作者们有意使得这一约束严格,当两个比例尺包含的元素不完全相同时,也要求相同的部分的元素顺序一致。

确认(9)

对于不同视图中的同一标称属性,一些被试有意识地使用相同的过滤条件和排序方式,使得比例尺中包含顺序相同的属性值,即使这一属性值可能对应空值。

设置过滤和排序条件使得标称属性的XY比例尺一致。

确认(10)

对于Tableau中一种特殊的属性,测量名称(measure name),作者们发现一些被试在收到关于一致性约束的警告后,认可这一警告,并进行修改。

例外(3)

一位用户将谷物名称分别按照评分、大小、热量进行排序,所以选择不遵守一致性约束。如图所示:

例外:按照不同方式对标称属性进行排序。

C2.2 不同属性⇒不同标称值

这一约束也应该自动符合。

确认(4)

由于这一约束一般自动实现,只有少数情况被试会检查不同属性的值是否有重合。

数值型颜色比例尺
C1.3 相同属性⇒相同颜色比例尺

这一约束要求相同的域:比例尺的开始值和结束值分别相同;相同的范围:开始和结束颜色分别相同;相同的映射函数:相同的数值应该被映射到相同的颜色。

确认(2)

在实验中,不同视图中使用颜色编码相同数值型属性的情况很少,一位被试硬编码了颜色比例尺的域,使得两个热力图的颜色比例尺相同。

这一约束没有例外。

C2.3 不同属性⇒不重叠的色度

这一约束要求域不相同,一般可以自动达成;要求包含不同的色度,目的是使得不同的色度与不同的属性相联系,防止误解。这一约束不要求颜色映射函数不同。

确认(2)

例外(7)

一些用户将数值分为好/坏等语义信息,使用不同色度代表这一语义。不同的数值属性采用这种语义进行映射时,色度会重叠。

标称型颜色比例尺
C1.4 相同属性⇒相同值-颜色映射

这一约束要求比例尺之间的域、范围和映射方式分别相同。对于测量名称,只要求映射方式相同,因为测量名称由用户手动指定,域可能不同。

确认(6)

一些用户有意识地确认了这一点,并在不同视图中使用相同的比例尺,比如温度的冷热分别用蓝和红编码。

确认(12)

关于测量名称,一些用户针对不同的属性,有意识地采用与属性绑定的颜色,比如一位用户创建关于谷物各属性值的柱状图时,有意使得不同属性对应的柱状图采用不同的颜色。如下图所示:

不同标称属性使用不同颜色色度案例

C2.4 不同的属性⇒重叠的颜色

不同属性的值域一般不同,C2.4要求不同属性使用的颜色集不重叠,因此映射函数也自然满足约束。

确认(5)

一些被试自发地意识到这一点,还有一些被试因为一个属性的基数大,忽视了颜色的重叠,在接受警告后,进行了修改。

例外(4)

一些被试认为当一个属性的基数较大时,颜色只是为了区分,而非记忆,所以他们选择不遵守一致性。

C2.5 标称值对应的颜色与常量颜色不同

C2.5要求可视化中的一些常数颜色,例如柱状图的颜色,与标称值的颜色不重叠。

确认(2)

一位被试自发地将柱状图的颜色从蓝色改为灰色来避免冲突。

例外(2)

与C2.4相似,一些被试认为对于基数大的属性,可以不遵循这一约束。

对于一致性约束模型的反思

从实验结果,作者们对一致性约束模型进行了初始的评估。

在实验中,确认的计数大于例外,共有90个确认,49个例外。将确认分为用户自发遵守和经过警告以后遵守一致性约束,对C1/C2,XY/颜色和数值型/标称型进行统计,结果如图:

自发确认、警告后确认和例外按类别统计图

由上图可以发现:

  • C1的确认与例外比C2更频繁,这是因为C2一般可以自动得到遵守;
  • 关于XY比例尺的确认与例外比颜色比例尺更频繁,可能是因为实验中使用位置编码比使用颜色编码更频繁;
  • 所有经过警告的确认都属于C1,其中约一半是关于编码测量名称的标称型比例尺,且没有关于测量名称的例外,说明被试倾向于认为测量名称的一致性重要,但有时会忽视这一点。

自发确认、警告后确认和例外按约束统计图

如上图,当对比不同细节约束的确认和例外数时,发现:

  • 一些约束没有出现例外:C2.1,C2.2,C1.3,C1.4;
  • 一些约束出现比较高比例的例外:C1.1,C2.3,表明一致性约束需要综合考虑是否进行比较,是否造成过多的空白区域和色度的语义;

此外,作者们还发现,对于属性是否相同,需要更微妙的定义。一些被试会采用其它一些策略,如,坐标轴拥有相同的值标签,趋势线的一致性等。

可视化构建工具的设计

这一工作为可视化构建工具中的一致性的支持提供了初始的基础。

自动的不一致检测和解决

通过将比例尺分解表示成约束模型的3个成分,施加约束,系统可以输出违反一致性约束的信息。通过搜索可能的比例尺定义,实现对不一致性的解决。还可以利用用户的反馈引导和加速这一搜索过程。

设计混合式驱动的一致性界面

通过对被试的访谈,作者们总结了可视化系统中一致性的自动支持的一些建议。

  • 对不同的约束,确定它们适用的范围,从而确定何时系统需要执行约束条件;
  • 允许约束模型的个人化,能够根据用户是否采取警告,学习出适合用户的约束模型;
  • 提供修改可视化的代价的估计;
  • 给出修改后的预览图,以使用户可以快速观察修改后的效果,并提供接受或者拒绝的选项;
  • 清楚地向用户传达不一致之处和可能的影响。

结论

这篇论文扩展和验证了一致性约束模型,提供了第一个对用户感知和遵循一致性的仔细研究。这个工作确认了可视化作者达成一致性的策略和一些例外情形,并提供了一致性模型和工具支持的建议。

参考文献

[1] Zening Qu, Jessica Hullman “Keeping Multiple Views Consistent: Constraints, Validations, and exceptions in Visualization Authoring,” IEEE Transactions on Visualization and Computer Graphics (Proc. InfoVis) 24(1): 468-4772018

评论关闭。