Stroscope: 不规则测量时序数据的多尺度可视化方法(Stroscope: Multi-Scale Visualization of Irregularly Measured Time-Series Data)

生活中很多被记录的数据都有时间信息:信用卡刷卡记录了消费行为、健康测量数据记录某个病人在发病时各项指标系数。传统时序数据可视化可以展示数据值随着时间如何变化,比如观察折线图中曲线的起伏,信用卡消费支出的变化一览无疑。然而,不知你有没有思索过,这些可视化方法是否“准确如实”地传达出测量数据的所有信息?
这里,一篇有趣的论文就指出了这么一个问题,一个极其重要却往往被传统时序数据可视化忽视的现象:大多数的时序数据都是伴随着事件发生,其测量的的频率间隔并不规则,对这类非规律频率测量的时序数据(以下简称非规则测量时序数据)而言,测量频率/测量间隔本身也是一个重要的信息。比如该如何表示缺省的测量值?对于没有测量点的时间段,传统的采用插值的方法来猜测的数值是否会造成误会?

论文的作者指出,这个曲线可视化没有能力展示的地方,与箱图(bin chart)可视化方法是互补的:箱图突出了时序数据的测量频率,却不太擅长于展示时序变化。所以,这篇论文的作者结合了这两种可视化的方法的长处,提出了一种叫新的方法脉动图(Ripple graph)。它同时突出了时序数据的变化和数据频率,从而更尊重非规则时序数据的真实信息。基于脉动图的可视化方法,作者实现了一套针对非规则时序数据的可视分析系统,名为“Stroscope”。作者和神经学家进行了长达半年的紧密合作,观察专家使用系统来分析中风病人的数据的过程,从而对系统进行评定。用户研究的结果显示这个新的可视化方法和系统比传统的时序可视化更有效地阐释了非规则时序数据的特征。

曲线图(line graph)展示时序数据的数值随时间变化,箱图(bin graph)则强调出数据发生的频率,脉动图(ripple graph)则结合了两者的优点

曲线图(line graph)展示时序数据的数值随时间变化,箱图(bin graph)则强调出数据发生的频率,脉动图(ripple graph)则结合了两者的优点

脉动图的设计主要从整合了曲线图和箱图两种方法各自的长处出发,如上图所示。另外还有一些独特的设计方便用户查看数值范围、数据频率。比如,为了便于比较数据出现的某个特定的数值,作者特意将脉动图的横轴坐标变成了可以上下移动的。此外,由于数据测量的不规则性,为了区别相对零值和缺省值的差别,特地将横洲变成了双横线,相对零值变成了一个显眼的小短柱。再比如,数值柱被分割成了不同的颜色,并且纵轴支持鱼眼放大功能,以此来强调特定数值范围。这些设计细节如下图所示。
design

对于缺省数据,插值有一定的代表性,同时可信度随着插值范围的增大而减小。估作者用透明度的设计表示对缺省数据在一定范围内的预测,如下图。
alpha

为了说明脉动图对非规则数据可视化的有效性,作者设计了一套用户评测方法,将其于另外三种传统时序数据可视化方法进行比较。这三种方法分别是:曲线图(Line graph, LG)、箱图(Bin graph, BG)和交互型地平线图(Interactive horizon graph, IHG)。评测的标准有三个方面,分别是完成某项分析任务的时间、完成分析任务的准确度以及用户认为该可视化方法的难度。测试的结果显示,脉动图明显比另三种传统方法对非规则数据的可视分析有更好的效果,如下图所示。

result

基于脉动图,作者扩展出了针对非规则时序数据的可视分析系统。对于非规则时序数据的分析,有一下几点设计准则需要遵循:
1. 展示测量频率/测量间隔
2. 展示出数值的时序变化
3. 焦点+上下文(focus+context)风格的可视化
4. 简单容易学习
5. 界面整合的可视化方法相互联动
6. 支持多个时序数据
7. 支持对多个时序数据进行比较
8. 支持简单的统计方法

Stratoscope就是以上述宗旨设计的系统,下图是它的交互界面。用户在主视窗中对多条时序数据比较,通过操纵控制视窗中的参数来调整脉动图的外观,比如横轴数值、鱼眼参数以及颜色映射等等。具体的数值可以在右边的表格中查看。
interface

这篇文章对传统时序数据的缺点做了改进,结合了两种可视化方法的长处(箱图擅长展示频率、线图擅长于解释变化),提出了脉动图的方法,并且通过用户研究证明了它相比传统可视化方法的有效性。最后,作者实现的基于脉动图的可视分析系统帮助用户提供了分析非规则时序数据。

[1] Myoungsu Cho, Bohyoung Kim, Hee-Joon Bae, and Jinwook Seo. Stroscope: Multi-Scale Visualization of Irregularly Measured Time-Series Data. IEEE Transactions on Visualization and Computer Graphics, 20(5), 808-821.

评论关闭。