IGAL可视化讲习班-2:未来工作模式: 使用先进可视化技术提升交流与合作 – 赵健

可视化前沿讲习班第一天上午的第二个课程由来自美国FX Palo Alto实验室的赵健研究员讲授。赵健研究员博士毕业于多伦多大学,他的研究兴趣主要包括信息可视化、人机交互以及数据科学。近几年他在CHI、InfoVis和VAST上发表十余篇论文,其中多篇获得了Honorable Mention。本次课程他从数据、模型和用户的关系出发,给学员们带来了精彩的演讲。

图1 赵健研究员正在讲授课程

当今时代,数据、模型和用户三者都得到了长足的发展。大数据催生了许多产业的出现;深度学习使模型变得越来越复杂;多人合作模式也对传统工具提出了新的挑战。赵研究员主要介绍了第三部分的内容,即在数据量越来越多、问题越来越复杂的情况下,如何提高人们交流的效率。

赵健研究员主要从以下四个方面展开介绍:

  1. Externalization(外部化)。如何把脑海中的想法展示给大家;
  2. Externalization from data(从数据中外部化)。如何在数据中表达想法;
  3. Knowledge transfer(知识传递)。在异步协作过程中如何把想法或者知识传递下去;
  4. Knowledge summarization(知识汇总)。分析人员合作分析某个问题时,如何把各自的分析结果合并以提升现有分析质量并指导下一步分析方向。

外部化主要考虑如何规划和组织想法。现有的工具主要用于台式计算机,大多不支持预写或者只支持少量预写功能,在实用性和灵活性上存在一些问题。赵健研究员等人希望把多种预写策略组合起来,从而能够给用户提供更多的灵活性以及功能。通过调研,他们确定了以下四个设计目标:

  1. 多策略。在迭代和灵活的工作流程中支持多种构思策略;
  2. 转换为逻辑顺序。帮助用户找到提出想法的逻辑顺序;
  3. 推荐语义和结构。帮助用户找到灵感,产生想法并克服障碍;
  4. 类似于纸的功能。支持自由形式的预写。

基于以上四个设计目标,他们提出了一种新颖的笔和触摸可视化工具InkPlanner[1]。InkPlanner允许用户在预写期间利用视觉图表进行构思。它进一步允许用户通过使用新颖的部件NarrativeLine(叙事线)将他们的想法分类为逻辑和连续的叙述。使用叙事线,InkPlanner可以自动生成文档大纲。此外,它还能向用户推荐由机器生成的语义和结构。

我们可以通过在数据中进行标注来传达各自的见解。然而,这种标注受限于数量,且无法传达复杂的关系。此外,我们也无法从标注中重获思考过程——哪个标注是最先出现的?它们之间的依赖关系如何?赵健研究员等人提出了Annotation Graphs[2],希望以图的形式来解决上述问题。他们首先根据语义将标注分成数据分割、短标签和文本评论三种类型。之后,他们提出了一种混合主动的图形布局方法,它将分析师的手动操作与基于标注语义推断相似性的自动方法相结合。三种可视化图形布局样式(投影图、圆形图以及切片图)揭示了标注语义的不同视角。

知识可以在多人之间传递,在协同分析场景中常常需要传递知识。赵健研究员介绍协同分析可以分为同步和异步,这里考虑异步协同分析。他举了医院医生交接班的例子说明异步分析的实际例子。在交接时,首先需要了解之前的医生已经对病人进行了哪些诊断和治疗,避免重复。知识的传递同样需要有这样的交接的过程以理解已有的知识。交接使得在知识的传递过程中,人们发现知识的过程存在重叠。为了高效传递知识,需要减少重叠。赵健研究员介绍了提高知识传递效率的工作,KTGraph[3]。KTGraph应用于在文本分析中创建概念地图。用户可以交互创建概念,添加文献等客观证据,自己的主观想法以及贴标签,告知后面的分析者问题、重点以及下一步工作。KTGraph提供一个交互式的时间轴,允许用户回放已有分析的产生历史。赵健研究员介绍了验证分析历史功能是否有效传递了知识的实验。实验发现,与没有历史回放功能的基线相比,KTGraph能够让更多的用户选择最高效的策略,减少对前人已探索文件的重复访问。

知识汇总是一个并行的过程,可以归纳多个分析者的发现,发现其中的关系,以及可能可以发现新发现的角度。赵研究员以Jupyter Notebook为例。使用Jupyter Notebook,在创建的文档中,用户既可以写下文字,也可以编写和运行代码。它记录了一个数据分析者的分析过程。

但是对于多人协同分析的场景,Jupyter Notebook没有提供很好的支持。比如,其他人已经在哪些空间中进行了充足的探索,还有哪些部分需要进一步的分析。赵健研究员介绍了他们解决这一问题的工作,Chart Constellation[4]。投影图视图中,每个点对应一个可视化图表。点与点的相似性度量使用映射相似度、维度相似度和关键词相似度的加权平均。其中,映射相似度指可视化形式的相似度,维度相似度表现了维度的重合程度,而关键词相似度是根据用户的注释生成的词向量的余弦相似度。投影图中,相似的节点形成有意义的聚集,类似于相近的星星组成星座,Chart Constellation由此得名。投影图能帮助用户减少重复劳动。在树图视图中,用户可以观察维度组合出现的频率,发现未探索的空间并进行研究,可能获得新的洞察。用户可以在图表视图中创建新视图。图表视图也允许用户探索之前已经生成的视图。系统也可以推荐可能发现新洞察的图表。赵研究员最后介绍了验证工作有效性的对照实验。实验中,被试

使用有总结功能的或没有总结功能的Kaggle Kernel,先完成有明确目的的任务,再自由地探索团队的发现,得到洞察。最后发现,用户在使用Chart Constellation时,可以发现更多的洞察。

在提问环节, 学员们踊跃提问,赵健研究员一一作了解答。有人问,这些工作能否应用于探索可视化的发展史。赵健研究员举了可视化的变与不变的例子,相似的可视化会聚集在相近的地方,比如流图的静态形式是不变的部分,而交互则是变化的部分。这些工具也可以更容易管理发现的过程。对于软件开源的问题,赵健研究员回应, 部分软件开源,并且这些工作是公开发表的论文,有兴趣的同学也可以进行复现。此外,还有同学就投影图的理解以及二维三维表现的差异提出疑问,赵研究员分别详细解释了可视化的形式和设计的选取。

图12 讲习班学员向赵健研究员提问

最后,北京大学袁晓如研究员给赵健研究员颁发了纪念奖牌,感谢他所做的精彩演讲。

图3 讲习班学术主任袁晓如研究员向赵健研究员颁发纪念奖牌。

参考

[1] Zhicong Lu, Mingming Fan, Yun Wang, Jian Zhao, Michelle Annett and Daniel Wigdor. InkPlanner: Supporting Prewriting via Intelligent Visual Diagramming. IEEE Transactions on Visualization and Computer Graphics, 25(1): 277-287 (2019).

[2] Jian Zhao, Michael Glueck, Simon Breslav, Fanny Chevalier and Azam Khan. Annotation Graphs: A Graph-Based Visualization for Meta-Analysis of Data Based on User-Authored Annotations. IEEE Transactions on Visualization and Computer Graphics. 23(1): 261-270 (2017).

[3] Jian Zhao, Michael Glueck, Petra Isenberg, Fanny Chevalier and Azam Khan. Supporting Handoff in Asynchronous Collaborative Sensemaking Using Knowledge-Transfer Graphs. IEEE Transactions on Visualization and Computer Graphics. 24(1): 340-350 (2018).

[4] Shenyu Xu, Chris Bryan, Jianping Kelvin Li, Jian Zhao and Kwan-Liu Ma. Chart Constellations: Effective Chart Summarization for Collaborative and Multi-User Analyses. Computer Graphics Forum. 37(3): 75-86 (2018).

 

2 条评论。

  1. 文中的「Jupiter Notebook」应为「Jupyter Notebook」。