传统的散点图随着数据复杂性和数据量的增长逐渐无法胜任可视分析的任务,因此,对传统散点图的修改和扩展设计层出不穷。针对具体分析目标,研究人员如何设计和选择合适的散点图也面临着更多的选择和挑战。这篇论文[1]旨在帮助设计人员针对散点图可视化形式做出合适的设计。通过调研相关文献,论文总结出针对散点图的分析任务、数据特征、设计方案等,通过结合这三者,提出存在的问题与挑战,并给出好的散点图设计示例。

图1. 散点图设计(列)根据数据特征(行)对分析任务提供了不同级别的支持
图1中,针对三个代表性数据集,将传统的散点图(左列)、六边形分箱(binning)实现(中间)与 Splatterplot [2] (右)进行比较。 一个散点图设计的适当性是基于数据的特征和该设计所支持的观察者任务(例如识别异常值或比较分布情况等)的。 对于少数随机分布点(顶行),传统的散点图(左)明确地描述了数据。随着点数的增加(中间行),分箱(binning)等聚集表示方法(aggregation representations)(中间)传达了空间密度。 对于重叠分布(底行),基于密度的表示方法展示了重叠,也可以显示异常值(outliers)(右),而后者在分箱表示(中间)时无法显示。
论文指出,一个散点图设计的适当性是基于数据的特征和该设计所支持的观察者任务的。作者给出了针对散点图的分析任务总结表、数据特征表、设计方案表。

表1. 针对散点图的抽象化分析任务表
表1中,分析任务类别来源于现有文献,通过卡片分类(card sort)分为3个类别,并根据可视化分类进行细化。

表2. 本工作考虑的数据性质及其可能的数值
表2中,数值是相对一个图形大小为6×6的400×400的散点图得到的。

图2. 数据分布种类
对于散点图设计,论文根据Point Encoding、Point Grouping、Point Position、Graph Amenities给出各种设计选择的列表,如表3所示。

表3. 散点图的设计方案分类
表4展示了针对数据特征为:“大”数量数据点、拥有几个不同类别的数据集,不同视觉编码(visual encodings) 对可是分析任务的支持情况。✔ 表示普遍支持(general support), ✔✷ 表示在特定情形下支持,✧ 表示需要同时有其他编码提供支持,✘ 表示对任务没有支持作用。表中C1-C4可以看出,点聚集编码(point grouping encodings)本身并不能很好地支持以物体为中心的分析任务(object-centric tasks),常见的策略是同时提供对物体的筛选(filtering),并高亮(highlight)出被选中的物体,在聚集编码的上面叠加(overlay)显示。也可以通过各种交互式的透镜技术[3](interactive lensing techniques)来支持这些分析任务。

表4. 任务支持表
一个好的散点图应该综合考虑到数据特征、分析任务和设计选择。

图3. 三种散点图设计的比较
如图3所示,针对一个“中等数量”数据点的拥有4个不同类别的数据集,从左到右的传统散点图、等高线图(Contour map)、Splatterplot分别展示出了不同的信息。传统散点图有一定程度的过度绘制(overdraw),而后两者通过点聚集技术重点支持数量和分布比较任务。等高线图展示了密度梯度,而Splatterplot利用阈值区域(thresholded regions)来展示密度信息,同时展示了异常值信息。
论文通过总结针对散点图的分析任务、数据特征、设计方案等表格,指出散点图设计的适当性基于数据的特征和该设计所支持的观察者任务,通过相关的任务支持程度分析和经典案例分析,帮助设计人员针对散点图可视化形式做出更合适的选择和设计。
参考文献:
[1] Sarikaya, A., & Gleicher, M. Scatterplots: Tasks, data, and designs. IEEE Transactions on Visualization & Computer Graphics, (1), 402-412, 2018.
[2] Mayorga, A., & Gleicher, M. Splatterplots: Overcoming overdraw in scatter plots. IEEE transactions on visualization and computer graphics, 19(9), 1526-1538, 2013.
[3] Tominski, C., Gladisch, S., Kister, U., Dachselt, R., & Schumann, H. Interactive lenses for visualization: An extended survey. In Computer Graphics Forum, Vol. 36, No. 6, pp. 173-200), 2017 Sep.
评论关闭。