2021年北京大学可视化发展前沿研究生暑期学校 – Day 3

今天(7月16日)是北京大学可视化发展前沿研究生暑期学校的第三天。今天的主要内容包含可视化设计空间和可视化设计实践两个部分。

下午,由北京大学的袁晓如研究员为同学们带来可视化设计空间相关课程。袁老师从可视化工作流程出发,逐步剖析由数据转化到可视化设计,并最终被观众认知的过程中的各个重要步骤。

Visualization Pipeline 可视化流程示意图

第一个重要步骤是数据的转化。数据的处理能够帮助人们更方便地完成数据探索。以新冠疫情期间传播很广的一个可视化图表为例(见下图),坐标轴的横轴使用的并非是普通的时间轴,而是以各个国家产生10例死亡病例作为时间的起点。

新冠疫情中各个国家死亡病例数情况

选取这样的横轴至少包含了两个好处——其一是将各个国家的时间进行了对齐,消去了由于各个国家疫情起点时间不同而差生的时间偏差,使得比较不同国家的数据更容易;另一个是使用了第10例死亡病例的时间,相比于第1例死亡病例出现时间,这样的数据处理可以尽可能地减小随机误差。

另一个数据转化的例子是对于群居动物行动轨迹的分析。通过计算求得轨迹的行动中心,就可以简单地区分族群中不同分工个体的行为模式。负责外出探索采集的个体相比于在巢穴中工作的个体,行动中心会更加偏离群体中心。

以上两个例子可以看出,进行数据处理、转化可以使得对于数据探索的工作更加轻松。因此,在可视化工作中,数据转化是非常重要的一环。

随后,袁老师通过分析各种各样的针对美国2020年大选情况的可视化,带领同学们感受可视化的设计空间。

各式各样的美国大选可视化

尽管所使用的的数据均是美国各州投票情况,可视化的样式仍然是多种多样。无论采用传统的地图,或是使用变形地图、象形图标,或是使用实体材料进行可视化展示,都有自身的优势。这些不同的可视化工作,对于数据的处理、变型,所针对的受众有所不同,因此选用了不同的方法,最终呈现出不同的样式。

接下来,袁老师又与同学们分享了各式各样的针对新冠疫情的可视化工作。新冠疫情是一场全球性的灾难,但是在疫情期间,人们对于数据的可视化需求大大增加,对于可视化本身来说是难得的快速发展时期。各类可视化工作使用了不同的可视化方法,从不同的角度展示了新冠疫情在全球各个国家,各个重要城市的发展情况。北京大学可视化与可视分析实验室针对新冠疫情可视化进行了收集与标注,这项工作仍然在不断进行中,欢迎大家进行补充或是帮助标注。

随后,袁老师介绍了对于树可视化(针对层次结构数据)设计空间探索的工作GoTree [Li, et al. 2020 CHI]。GoTree抓住了层次结构本身所具备的递归性,将树可视化解构成为基础元素的递归组合。接着从布局、结点之间关系、坐标系选择等方面,对于组成树可视化的基础元素进行解析,最终构建了一套语法来描述树可视化结构,并设计了交互系统帮助不熟悉编程的用户快速构建各式各样的树型可视化。GoTree的语法虽然不复杂,但是能够覆盖超过1000万种可能的树可视化,是成功的树可视化设计空间探索工作。

GoTree [Li, et al., 2020 CHI]

最后,袁老师分析了可能导致不好的可视化的原因。除了十分明显的错误之外,还有一些可视化看似没有问题,但是仍然会存在各式各样的误导问题。例如对于地图的染色,传统地势图中蓝色代表水,橙色代表陆地的习惯性用法一旦被用于其他的编码方式,就可能对于用户产生误导。可视化中,这一类问题并不明显,需要谨慎考虑。

晚上,由徐瑞鸽教授为大家带来可视化实践的相关课程。首先,徐瑞鸽教授为我们介绍了可视化中的字体选择。

为可视化挑选字体时,需要考虑的因素

在为可视化挑选字体时,需要考虑 x-height、counter、serif 等因素。对于小字号,选择 x-height 更大、counter更稳定开放的字体具有更好的可读性;另外,在小字号下,有些衬线字体是合适可选的,如果不能确定衬线字体是否合适,可以使用非衬线字体。
在为可视化挑选数字时,可以使用等高等宽数字,便于对其比较。

小字号下的不同字体效果

在可视化系统的字体排版中,可以使用不同的模式。比如系统中只使用同一大小的同一字体,使用不同的字体粗细进行强调;使用较大的字号表现标题;在不同的部分使用不同的字体等模式。

可视化系统使用同字号的同字体,不同的粗细

在字号大小上,徐教授表示通常屏幕显示的字体不要小于9号,印刷用的字体不要小于6号;在可视化系统中使用16大小的字体对用户更具可读性。

接着,徐瑞鸽教授为我们介绍了几种可视化图表设计中的最佳实践,包括 bar chart、pie chart、line chart、area chart、scatter plot、bubble chart、heat map 等。

例如在 pie chart (饼图) 中,不要使用多个饼图进行比较,不要在数据较多时使用饼图,保证各项和为100%等。

Pie chart 的设计实践

Bar chart 的设计实践

可视化是用来和用户交流的工具,用户体验是至关重要的。徐瑞鸽教授介绍了
评价用户体验的Honeycomb model,从共三类七个方面来对用户体验进行评价。

Optimized Honeycomb model

最后,徐瑞鸽教授介绍了Dear Data Project,由生活在大西洋两岸Giorgia Lupi和Stefanie Posavec发起,通过收集和手工绘制他们的个人数据并以明信片的形式发给彼此。

Dear Data Project – 两张明信片

评论关闭。