随着大数据时代的来临,可视化技术的运用越来越广泛。媒体人、政治家纷纷利用可视化图片表述自己的观点,以赢得大众的支持。尽管这些可视化图片可以直观的传达大量信息,但他们同时也会扭曲信息,误导大众。许多时候这种误导的故意的:可视化图片的制作者会故意通过扭曲可视化结果来增强其效果。也有时候,这种误导是无意的:制作者可能对可视化技术并不熟悉而错误的使用了某些技术。在CHI2015会议上,来自美国纽约大学(NYU)的几名研究者报道了他们在这方面进行的实证研究工作[1]。他们将这类误导性的可视化成为欺骗性可视化(Deceptive Visualization)。从图1中的一些典型的案例出发,它们对相关的技术进行了分类,并通过实验研究了其中一些技术对人理解图片含义造成的影响。此外,他们还研究了不同类型的人对欺骗性可视化的反应。
他们认为产生欺骗性的可视化的方法主要包括两类。一类是通过直接修改数据来完成,例如修改数值,或者去掉某些样本。另一类是通过使用扭曲的可视化映射来完成的,这些方法可以夸张或减弱传达的信息,也可以反转传达的信息。该研究主要讨论的是第二类。例如图1(b)中,油价(Cost of Gas)曲线很陡,似乎油价变化巨大。但仔细看会发现,制图者对Y轴进行了截取。这里显示的油价范围是$2.90-$3.60,因此尽管油价只是从$3.17上升到了$3.57,但给人的影响却是油价显著上升。这是一个通过截取Y轴达到信息夸张/减弱效果的例子,类似的例子也出现在图(c-e)中。图1(f)中用气泡图比较了联邦政府职员的工资和私有部门职员的工资。两个气泡的大小差别巨大,似乎表示联邦政府发的工资非常高。但仔细看数字会发现,这里的工资差别只有3倍,并没有看上去那么高。在这幅图中,制图者使用气泡的半径表示数值,而不是面积,也达到了信息夸张/减弱的效果。最后,在图1(a)中,制图者绘制了美国佛罗里达州(Florida)每年的枪击死亡人数。看上去死亡人数似乎先上升到一个峰值,然后下降。但仔细看Y轴会发现Y轴的方向和一般方向相反:小值在上,大值在下。因此死亡人数的实际变化趋势是先下降后上升。这是一个通过反转轴达到信息反转效果的例子。
为了研究不同扭曲技术对人的影响,研究者利用亚马逊公司(Amazon)提供的Mechanic Turk服务做了一个实验。在实验中,研究者们共邀请了330位被试进行来读图,并回答相应的问题。研究者通过分析测试结果来判断扭曲技术的影响。由于可视化技术多种多样,而不同的可视化技术又有不同的扭曲技术可以达到欺骗效果,因此扭曲技术实际上是多种多样的。在本研究中,研究者选择了一些简单的但是应用广泛的扭曲技术进行了测试。这些技术包括四种:
- 柱状图中的Y轴截取
- 气泡图中的大小映射
- 折线图中的宽高比
- 折线面积图中的Y轴方向
其中前三种技术对应信息夸张/减弱,最后一种技术对应信息反转。对于每一种技术,研究者设计了相应的问题。图2(a)展示了“柱状图中的Y轴截取”对应的问题,其中不同的被试分别要求观看左边的控制组图(Control)或者右边的欺骗组图(Deceptive),然后回答类似“你认为Y的数值比X的数值大多少?”的问题。回答的方式是从1-5的李克特(Likert)量表中选择一个值,其中1表示稍稍大一点(slightly bigger),而5表示大很多(Substantially bigger)。每个被试只会看到其中一幅图,并回答一幅图对应的问题。类似的,图2(b)和(c)分别对应“气泡图中的大小映射”和“折线图中的宽高比”,被试分别利用1-5的李克特量表回答类似“你认为Q2比Q1大多少?”和“你认为数值在这段时间内增加了多少?”的问题。图2(d)则展示了“折线面积图中的Y轴方向”对应的问题,被试需要选择“增加”或者“减少”来回答“你认为数值在这段时间内有何变化?”。
对于前三个问题,研究者们测量了被试在控制组和欺骗组作答的平均值。如图3所示,在欺骗组的答案明显高于控制组,证明欺骗组的被试认为数值差异更大。因此,这些扭曲技术确实“欺骗”了被试。对于最后一个问题,研究者测量了被试在控制组和欺骗组的准确率,发现控制组准确率高达97.5%,而欺骗组只有18.5%。这证明欺骗组的被试确实被骗了。
此后,研究者还测量不同的教育程度、识图水平、可视化熟悉度以及认知需求(Need for Cognition)对被试测试结果的影响,但并没有得到明确的结论。
由此我们看到,可视化既可以帮助人们发现和展示数据中的规律,也可以误导人们,给其错误的信息。作为可视化的研究者和使用者,我们都需要小心谨慎。
[1] Anshul Vikram Pandey, Katharina Rall, Margaret L. Satterthwaite, Oded Nov and Enrico Bertini. How Deceptive are Deceptive Visualizations?: An Empirical Analysis of Common Distortion Techniques, in Proc. ACM SIGCHI, pages 1469-1478, 2015.
评论关闭。