CrowdLayout: Crowdsourced Design and Evaluation of Biological Network Visualizations

生物学家经常会用网络来分析实验中的现象,比如细胞内分子的交互,电信号在神经元之间的传递,但是创建一个能够有效表现生物学信息的网络扔存在挑战。尽管有大量的自动图布局算法,但是这些算法没有利用网络中生物学信息,生成的布局效果没有实际意义;专家通常会利用自己的专业知识通过手动的方式对这样的网络布局,但是这样的布局方式效率太低,难以短时间内对大量网络数据生成有效布局。所以这篇文章通过众包的方式让普通用户在一定的准则下,帮助专家创建、评估网络数据的布局[1]。

图 1. 图布局编辑界面

如图1为图布局的编辑页面。专家可以上传图数据到该系统,可以选择自动的布局算法,或者手动,完成布局。当专家选择众包的方式后,系统会通过Amazon Mechanical Turk招募五个用户,让五个用户分别利用这个页面创建布局,创建好的布局结果会返回给专家,让专家评估。

因为普通用户缺乏领域知识,为了帮助他们生成有意义的布局,系统提供了如下4个生成准则:

  1. 将三角形排列在布局的顶部
  2. 将正方形排列在布局的底部
  3. 将相同形状的节点排布在一起
  4. 将相同颜色的节点排布在一起

这4个准则具有实际的含义。这里三角形代表细胞壁上的蛋白质,正方形代表细胞核中的蛋白质,而其它形状和颜色的节点也有着特定的含义。根据这样的准则创建的图布局结果能够反映出细胞中信息流动情况。

图 2. 不同用户和专家生成的网络布局

为了评估用户生成布局的有效性,作者设计一个评估实验。作者基于6个代表性的生物网络数据,使用了两种布局算法,招募了5位用户,1位专家,一共生成了48个布局。针对这些布局,邀请了另一位专家对这些布局结果打分。

图 3. 不同方式产生布局的打分结果

如图3所示,算法布局产生的效果最差,而普通用户的布局结果相对较好,但是还是和专家布局产生的布局结果有一定的差异性。这是因为用户创建布局时候依据的准则并不能完全体现专家的心理预期,但是太多的准则会导致非常复杂的操作。此外,作者还评估了通过众包方式对图布局评估的可行性,结果证明用户的评价结果与专家的评价结果比较吻合。

这篇文章提出了通过众包方式,解决大量图数据的布局以及评估问题。专家在布局的时候往往利用到自己的领域知识,对布局结果有一个综合考量,然而这些考量有的并不能完全显示定义出来加入到算法中,因而算法产生的布局往往不能满足需求。

参考资料:

[1] Divit P. Singh, Lee Lisle, T. M. Murali, Kurt Luther. CrowdLayout: Crowdsourced Design and Evaluation of Biological Network Visualizations. CHI 2018: 232 – 245.

评论关闭。