PieceStack: 更好理解堆叠图 (PieceStack: Toward Better Understanding of Stacked Graphs)

对于多条时变数据的可视化与分析有多种方法,包括了多折线图、堆叠图、折线图的Small Multiples布局等。作为一种直观的多时序数据可视化方法,堆叠图因其直观形象的可视化表达被广泛使用。但同时由于存在着比较困难、当时序数据数量增加时可伸缩性差等缺点,被谨慎地用于可视分析中。本文[1]提出一种基于堆叠图的可视化设计,PieceStack,更好地理解和使用堆叠图进行时序数据的分析。

堆叠图将一条时变数据表现为一条带(称之为 “层”),将多条带按共同基线的方式依次堆叠(层层堆叠的组合,称之为“聚集”)形成的展示多条时变数据的可视化形式,其中每条带在特定时间点的幅度表示对应时变数据的数值。本文作者通过调研堆叠图上时变数据分析任务,总结出了三种分析任务:

1)层-层:作为一种堆叠图中基本分析任务,比较层间,找出层间相似时变趋势是进行更为复杂任务的基础。

2)层-聚集:分析层与层的聚集之间的关系,最核心任务为分析聚集形态产生的原因,如聚集塌陷/隆起是由哪些层导致的。

3)聚集-聚集:作为一种较高层次的分析任务,理解聚集的时变模式,以及聚集与聚集之间的关联。

设计额外的可视化形式展现关系脱离了堆叠图的环境,不能支持进行无缝的时序分析,本文旨在基于原始的堆叠图上进行改进。而基于最基本的堆叠图进行模式视觉编码,会导致过于琐碎而失去对模式的判断。因此,本文的基本思路是从时变数据中通过聚类获得多时变数据的局部聚集变化模式(Segment Cluster),再将局部聚集变化模式、层-局部聚集贡献关系等信息视觉编码与堆叠图中。

屏幕快照 2016-05-06 下午5.51.40PieceStack设计的基本思路

局部聚集这个环节,包括以下几个步骤:1. 时变数据预处理:归一化后通过道格拉斯算法(Douglas-Peucker算法)近似时变数据,去除不必要的噪音;2. 对时间进行分段:抽取时变数据上所有拐点,按拐点集的分布将时间进行分段使得每段时间中都有大量的拐点,再将每段时间按照平均时间分为两段;3. 时间段内聚类:通过DBSCAN使用密度聚类算法对每时间段内的时变数据子段进行聚类,子段间的距离借鉴动态时间调整(Dynmaic Time Warping)算法来衡量;4. 合并不同时间段的类:通过不同的合并选择形成类的合并策略树,采用动态规划的算法寻找出既将未归类数据降低到最小又使类数量尽量小的一个合并方案;5. 对4所产生的类进行编号。

屏幕快照 2016-05-06 下午5.52.38局部聚集流程

基于局部聚类结果,对原始的堆叠图的可视化进行了以下几点的改进:1. 将聚类嵌入原始堆叠图:自下往上,将时间跨度由长至短的聚类堆叠:2. 将层、类与总体聚类之间的关系通过图标的方式内嵌于堆叠图中:各类中各层对总体聚集效果的平均贡献(类贡献,per-cluster contribution) 使用菱形表示 、所有层对总体聚类效果的平均贡献(平均贡献,average contribution) 使用圆形表示,两种图形的红-绿表示正向-反向贡献,同时饱和度表示并贡献绝对值的大小;3. 三种交互方式:刷选、选择、分解来帮助用户更好地探索PieceStack。例如在刷选时,用户可刷选三种对象,即层、类以及总体聚集。当刷类中某一层时,其在整个时间段内的分布都会被高亮。当刷某一类相当于刷某一簇层,高亮这些层所属的其他类。当刷总体聚集的某个时间片时,对应的所有类贡献就会高亮。

屏幕快照 2016-05-06 下午10.29.38由上而下与由下而上的堆叠顺序

下图为使用PieceStack对美国在2000年至2010年之间的14个行业的失业率时序变化的可视化案例。共有四个局部模式被监测出,分别为A,B, E, F。其中E,F横跨了整个时间范围。

屏幕快照 2016-05-06 下午5.53.47可视化行业就业率时序数据的PieceStack

通过查看如下图所示,在E类中的四个行业确实具有相似的失业率变化趋势。

屏幕快照 2016-05-06 下午5.55.00E类中的四个行业

通过内嵌的图标密度可以看出,在F类中具有密集的图标分布,说明F领域对聚集的趋势变化具有正向的贡献。将F类分离前后进行比较,可以发现在下图a时间点中存在F类失业量下降而总体上升的趋势,再进一步将E类分离,发现E类对总体上呈的贡献并不大(淡红色),所以可以推断在这个时间点上,主要是由A,B类的上升影响了总体的上升。

屏幕快照 2016-05-06 下午5.48.45分离单个聚类模式分析对总体的贡献

此外,本文通过控制用户实验证明了PieceStack的有效性。20个受试者完成设计好的5种不同任务的实验,比较了在PieceStack与传统的堆叠图下的完成时间与正确率。如图所示,PieceStack在完成时间和正确率上都优于传统的。

屏幕快照 2016-05-06 下午5.56.41用户测试结果

参考文献

[1] Wu, T.; Wu, Y.; Shi, C.; Qu, H. & Cui, W., PieceStack: Toward Better Understanding of Stacked Graphs. IEEE Transactions on Visualization and Computer Graphics, 2016, 22, 1640-1651

评论关闭。