为数据可视化选择具有语义共鸣性的色彩(Selecting Semantically-Resonant Colors for Data Visualization)


图1 斯特鲁普效应

图1 斯特鲁普效应

在进入正题前,让我们做一个小小的游戏:你能准确无误地读出图1中每个字体的颜色吗?相信你已发现了,读第一行要比第二行困难一些,即使你明知道那“红”字是绿色,你还是得努力把持住,不让自己念成了“红”。颜色与字义一致会加速认知过程,反之则会阻碍认知,这种有趣的现象称为“斯特鲁普效应”(Stroop Effect)[1]。其实,不单是颜色的名称,人们早已习惯将颜色与各种概念绑定在一起,就像“喜气洋洋 心平气和 郁郁葱葱”会显得奇怪,而“喜气洋洋 心平气和 郁郁葱葱”则更为自然,这些自然的、与语义一致的颜色被称为“语义共鸣色”(Semantically Resonant Color)。如果能有效利用语义共鸣色,我们是否也能提高可视化的认知效率呢?

基于这个想法,斯坦福大学的可视化小组研究了具有语义共鸣性的自动化色彩分配算法,并进行了一系列实验以验证算法对可视化效率的影响,该研究工作发表在2013年的EuroVis上[2]。该算法的第一步,是对一组特定类别的词汇如蔬菜(“番茄”、“土豆”、“青椒”等)进行谷歌图片搜索,并将搜索得的图片汇总起来,统计其中的颜色以产生颜色直方图。

图2 词汇相关的图片搜集

图2 词汇相关的图片搜集

第二步,他们对直方图作核密度估计以模拟色彩的分布,并据其计算候选调色板中每种颜色出现的概率,再兼顾色彩之间的辨识度,得到每一对“颜色-词汇”组合的“共鸣分数”(Affinity Score)。这些共鸣分数刻画了概念与颜色之间联结的强度。

图3 共鸣分数与匈牙利法

图3 共鸣分数与匈牙利法

第三步,根据所有共鸣分数,利用匈牙利法将候选颜色一一分配到词汇集中,使得总的共鸣分数最高,亦即色彩语义性最强。 最后,研究者们利用Amazon Mechanical Turk上的众包资源,要求参与者对相同的词汇集和颜色集进行匹配,并据此调整自动化算法的参数,使自动化分配的结果尽可能接近人为选择的方案。如图4所示,A、T两列分别为算法和人为产生的色彩分配方案,可见两者有不少近似的地方。

图4 算法与众包的分配方案比较

图4 算法与众包的分配方案比较

 

而在实验阶段,研究者们比较了三种不同的色彩分配对直方图阅读效率的影响,分别为专家选择、算法生成和随机分配的方案,如图5由左至右所示。其中专家选择的方案由商业可视化软件Tableau的设计者给出,作为其他方案效果的上限和准绳。在实验中,被试将会看到图5所示的三种直方图,并要求根据图上信息回答问题,其反应时间被记录下来作为直方图效果的度量。而实验的结果显示,对于着色性(Colorability)高、具有相对固定颜色的词汇,譬如“天空”、“草莓”、“土豆”等,具有语义共鸣性的色彩分配能提高约10%的反应时间,其中专家选择的方案略优于算法产生的方案。但对于抽象的、缺少固定颜色的词汇,如“可口可乐”、“谷歌”、“健康”等,语义共鸣性只能提供较小的改善。

图5 三种色彩分配的直方图比较

图5 三种色彩分配的直方图比较

正如文章中提到的,语义共鸣性可能只是省去了读者查询图例的时间。譬如图5左侧的直方图,各直方从左至右分别代表苹果、香蕉、蓝莓、草莓、葡萄、桃子和橘子,一旦读者知道了整个词汇集的组成,以后便可以根据颜色来迅速定位种类,并轻易地回答诸如“香蕉和草莓哪个更多”这类问题。事实上,不单是语义共鸣性,只要是约定俗成的、图元与概念之间的映射关系,都可以帮助人们提高认知效率。就像熟悉了文字与词义的对应关系后,就不必借助词典来通读文章一样。关键在于,可视化的设计者需要尽可能地运用这些固有联系,避免一些陌生的设计疏远读者与图的距离。即便是颜色分配的细微改变,都可以带来10%的效率差别,足见在可视化设计中,每一个细节都值得细细推敲、精益求精。

[1] Colin M. Macleod. Half a century of research on the Stroop effect: An integrative review. Psychological bulletin, 109(2): 163-203, 1991.

[2] Sharon Lin, Julie Fortuna, Chinmay Kund Jeffrey Heer. Selecting Semantically-Resonant Colors for Data Visualization. Computer Graphics Forum, 32(3): 401-410, 2013.

评论关闭。