信息可视化中的吸引效应(The Attraction Effect in Information Visualization)

吸引效应是人在两个选择之间的决定会被第三个不相关的选择所影响,这在心理学中是一个被广泛研究的问题。可视化是支持用户的决策的重要方式,比如当我们选择一个要购买的房子或者选择一个要雇佣的雇员,可视化可以帮助用户选择最优的决策方案,然而系统所导致的偏差会产生非常重要的影响。吸引效应所造成的认知偏差,目前仅仅在三个选择中被验证,并且仅仅使用表格,文本,图片的形式,但是其所造成认知偏差同样出现在可视化中。本文为了研究吸引效应在可视化中的存在情况,设计并完成了两个用户调研,在第一个众包的实验中,本文实际上重复了吸引效应的经典实验并且将其拓展到可视化中,并且发现在可视化中具有同样的用户认知偏差;第二个实验主要针对的是吸引效应是否可以被扩展到更大的数据集上,这一类的数据集因为数量的原因难以使用数据表格进行展现。实验结果同样表明,吸引效应所导致的偏差大规模数据集的散点图中同样存在。[1]

吸引效应是指用户在决策时倾向于选择一个存在相似但是略差的对比对象的决定。用一个实际的场景解释,公司选择要雇佣的职员,选择的所判断的指标有两个,分别是教育背景和工作经验,并且这两个指标同样重要,对于每个指标使用评分来决定应聘者的各项指标,评分越高,则该项指标越优。存在三个职员供选择,Bob教育背景的评分为5,工作经验的评分为2Alice的教育背景的评分为2,工作经验的评分为5;因为教育背景和工作经验是同样重要的,所以用户无法直接在两个候选人中进行决策;但是另一个职员Eve的教育背景的评分为2,工作经验的评分为4,虽然Eve是不可能成为用户最终决策选择的对象,但是用户在三个选项中进行决策时,更容易选择Alice,因为Eve是与Alice相同类型的对象,同时Alice是优于Eve的一个选择。这种现象就被称为吸引效应。

虽然吸引效应在心理学中是一个被广泛研究的话题,但是目前的工作主要针对的数据是数值类型的格式,因此无法确定吸引效应是否在可视化中同样存在;其次,这些研究通常针对的是小规模的数据,并没有将针对该问题的研究拓展到较大规模的数据中,因此吸引效应在可视化领域中还没有被人们广泛地理解认识。

针对上述问题中的第一个,吸引效应是否存在于可视化中,存在一些研究任务认为吸引效应仅仅限制在数字形式中,无法应用到用户感知的表达形式中。为了实际验证该结论,本文设计了第一个众包的用户测试。众包测试是在众包平台Crowdflowerhttp://www.crowdflower.com/ )上完成的,第一个用户测试主要是对于原始吸引效应实验的重复,主要是测试用户的决策偏差是否在可视化中仍然存在。在用户测试中,我们将所增加的略差于对比对象的元素称为诱饵元素。第一个实验的测试场景是用户选择一个健身房,评价健身房的指标主要有健身房的清洁程度以及健身器材的多样性。该用户测试所针对的用户主要来自于全世界不同国家的305个被试对象。第一个实验主要分为两个部分,即存在两种不同的数据表现形式,数值类型的表格形式以及对应的散点图可视化形式,在本实验中所采用的可视化形式是散点图,选择散点图的原因主要有四点:首先散点图是一个标准的信息可视化的技术;对于存在两个属性的数据表格,其中的每一个元素可以对应到散点图中的元素上;散点图可以方便的提供用户一个整体的全局概览;散点图可视化可以方便的扩展更多的数据对象中;该用户测试的表格数据以及散点图如图1所示。

图1 用户测试1:针对小规模数据集的表格形式和散点图可视化的吸引效应的测试

该用户测试的结果如图2所示,图2中左半部分的柱状图中分别展示在表格中与散点图中没有增加诱饵元素,在清洁程度上以及在健身器材多样性上增加诱饵元素之后用户的选择倾向,根据图2右半部分的总结视图中显示,在增加诱饵元素之后,用户的选择都受到了影响,使得用户倾向于选择比诱饵元素更优的元素。

图2 用户测试1结果分析:通过展示不存在诱饵元素以及增加诱饵元素之后用户决策情况得出结论吸引效应存在于可视化中

图3 用户测试1与用户测试2测试结果总结:吸引效应存在于可视化中同时可以推广到大规模数据集中

针对上述问题中的第二个,吸引效应是否能从小数据集扩展到较大规模的数据集,本文设计了第二个众包的用户测试。随着数据集中数据元素数量的增加,使用数值类型的数据表格用户难以比较数据集中元素之间的关系,但是使用散点图,用户可以清晰的得到用户的概览,并且帮助用户迅速理解数据,因此散点图适合用户对于该问题进行测试。相对于第一个用户测试的问题,在散点图中增加元素的方法主要有两个,一个是增加更多的干扰元素,另一个方面是增加更多的引诱元素,如图4所示,干扰元素是不会影响用户的判断,处于散点图中部的元素;引诱元素是影响用户判断,改变用户最终决策的元素。第二个用户测试同样是在众包平台(Crowdflower)上完成的,该用户测试的场景是股票,股票存在两个属性,一个是股票的价格,另一个赢得股票的概率,但是股票的总价值是相等的,与第一个用户测试一样的是存在干扰元素以及引诱元素,实际的用户测试的散点图如图4所示。第二个用户测试的结果显示吸引效应可以从小数据集扩展到大量的数据集上。

图4 用户测试2:吸引效应在大规模数据中用户实验设计,相对于用户测试1,增加了更多的干扰元素以及诱饵元素。

本文的工作主要针对心理学中广泛存在的吸引效应,并且针对吸引效应是否存在于可视化中以及吸引效应是否在大规模的数据集中存在设计了两个众包实验,该实验结果显示,用户的吸引效应是在可视化以及大规模的数据集中都存在的。针对吸引效应影响用户决策的问题,用户提出了避免影响用户决策的方法,即对于最优元素高亮显示,在其他元素上增加透明度,使得用户的关注重点集中在最优元素的选择上。

[1]Dimara E, Bezerianos A, Dragicevic P. The attraction effect in information visualization[J]. IEEE transactions on visualization and computer graphics, 2017, 23(1): 471-480.

评论关闭。