探索交互日志来减轻人的偏见(Left, Right, and Gender: Exploring Interaction Traces to Mitigate Human Biases)

偏见影响着人们分析数据的方式和决策的结果。在可视分析系统中,人的偏见会体现在只对部分数据进行分析而进行决策,使得决策产生偏差。该工作研究如何通过可视化用户的交互历史(用户与哪些数据点和属性进行了交互),来降低人在可视化系统探索过程以及决策时的潜在偏见。

在这个工作中[1],作者将用户在分析过程中的偏见定义为用户的实际交互行为和期望行为的偏差。期望的交互行为指数据集中的任何数据点有相同的交互可能性。作者使用了两种指标来量化交互过程的偏见,分别是交互数据点分布指标(DPD)和属性分布指标(AD)[2]。在一个数据集中,数据点分布指标描述了用户的交互在所有数据点的分布情况。用户的交互只围绕部分数据,表明交互过程有较大的偏见。属性分布指标描述了用户的交互在某个属性值的分布情况。用户的交互只涉及某个属性的部分值,表明交互过程针对该属性有较大的偏见。

图1:系统界面。用户使用该系统来从数据集中选择10个代表性数据点。

为了可视化用户的交互历史,作者设计了两种可视化形式。一种是原位(in-situ)可视化方式(图1B),即在用户交互视图中直接可视化用户的交互数据。图1B中,红色表示用户已经选择的数据点,蓝色表示用户检查过的数据点,颜色越深表明用户与该数据点交互次数越多。用户能够直接观察到与各个数据点的交互情况;另一种是非原位(ex-situ)可视化方式(图1C),每个图标表示一个数据属性,颜色越深表明针对该属性用户的交互偏见越严重。在下方的直方图中,灰色表示数据点在该属性上的实际分布,蓝色表示用户交互过的数据点的分布。

图2:用户实验结果。通过可视化用户交互历史,更多用户结果中男性成员的比例与数据集中比例更接近。

为了验证上述可视化用户的交互历史能否减低用户的偏见,作者设计一个对比试验。图1中的系统称为干预(intervention)系统,图1中去除了视图C以及视图B中可视化交互数据点功能后的系统称为控制(control)系统。分别有两组用户各使用两种系统来完成任务。任务的内容是从180位政治人物中选择10位来决定一个政治法案是否实施。实验分为两个阶段,第一个阶段是用户选择10位成员后然后提交;第二个阶段是用户查看各个属性的数据分布于自己交互数据分布差异(图1C)来决定是否修改结果(控制系统分组用户没有提供该功能)。图2是两种系统用户的的决策结果,可以看出更多使用干预系统的用户选择的结果更具有代表性。作者进一步的实验表明可视化用户的交互数据能够改变用户与可视化系统的交互次数,使得交互数据点分布指标更低,降低在分析过程中的无意识的偏见。

可视化强调人的参与,而人的选择和决策往往会和自己的知识背景、偏见等具有关联。可视化的流水线包括数据选择、处理、视觉映射和交互等多个步骤,因而在每个步骤中都可能存在人的偏见或者错误。如何减少可视化流水线中的偏见和错误需要可视化研究者们更多的研究。

参考文献:

[1] Emily Wall, Arpit Narechania, Adam Coscia, Jamal Paden, and Alex Endert. Left, Right, and Gender: Exploring Interaction Traces to Mitigate Human Biases. IEEE VIS 2021.

[2] Emily Wall, Leslie M. Blaha, Lyndsey Franklin, Alex Endert. Warning, Bias May Occur: A Proposed Approach to Detecting Cognitive Bias in Interactive Visual Analytics. VAST 2017: 104-115.

评论关闭。