标签存档: 时序数据

比较时间序列可视化中的相似感知(Comparing Similarity Perception in Time Series Visualizations)

使用时间序列数据的许多领域专家面临的共同挑战是如何识别和比较类似模式。该操作是很多研究任务的基础,例如检测重复现象或创建类似时间序列的簇。虽然存在用于计算时间序列相似性的自动测量算法,但是通常需要人工干预来视觉检查这些自动生成的结果。可视化文献已经检查了相似性感知及其与折线图的自动相似性度量的关系,但尚未考虑替代可视化表示(例如地平线图和色域)是否会改变这种感知。受神经科学家如何评估癫痫样式模式的启发,本文[1]进行了两项实验,研究这三种可视化技术如何影响EEG信号中的相似性感知。我们试图了解自动相似性度量返回的时间序列结果是否以类似的方式被感知,而与可视化技术无关;如果人们认为与每个可视化相似的东西与不同的自动测量及其相似性约束一致。我们的研究结果表明,水平图与相似性度量对齐,这些度量允许比其他两种技术更多的时间位置或速度的局部变化(即,动态时间扭曲)。另一方面,水平图不与对幅度和y偏移缩放不敏感的度量(即,基于z归一化的度量)对齐,但是线性图和色域的情况似乎是逆的。总的来说,我们的工作表明,可视化的选择会影响我们认为相似的时间模式,即时间序列中的相似性概念不是独立于可视化的。

继续阅读 »

事件线程:视觉总结阶段的事件序列数据分析(EventThread: Visual Summarization and Stage Analysis of Event Sequence Data)

事件序列数据,如电子健康记录、一个人的学术记录或汽车服务记录,都是一段时间内发生的一系列事件。分析事件序列的集合可以揭示常见的或语义上重要的序列模式。例如,事件序列分析可能揭示了常用的治疗疾病的护理计划,教授的典型出版模式,以及导致维护良好的汽车的服务模式。然而,在视觉上探索大量事件序列或大量事件类型的序列是具有挑战性的。现有的方法侧重于通过统计分析来提取事件的明确匹配模式,以创建随时间变化的事件进程的阶段。然而,这些方法未能捕捉到相似但不完全相同的事件序列演化的潜在簇。在本文[1] 中,我们引入了一个新的可视化系统命名事件线程集群事件序列为基于张量分析线程和可视化的潜伏阶段分类和演化模式的交互的线程分组相似到特定时间集群。通过用户与专家的访谈,在三个不同应用领域的使用场景,我们证明了事件线程的有效性。

继续阅读 »

ThermalPlot: 使用暖气流隐喻可视化多属性时序数据(ThermalPlot: Visualizing Multi-Attribute Time-Series Data Using a Thermal Metaphor)

多属性时间序列数据在许多不同的领域,如经济学,传感器网络和生物学中都起着至关重要的作用。理解这些数据的一个重要任务是为用户提供一个总览,帮助用户识别随着时间的推移显示出有趣的绝对和相对变化的数据项。但是,现有的可视化技术并不能很好地支持这一点。为了解决这个问题,作者提出了ThermalPlot[1],把多个属性随着时间的推移变化映射到空间中位置的变化。ThermalPlot中的x位置是基于用户定义的兴趣度Degree-of-interest(DoI)函数,该函数通过加权综合了多个属性数值。 y位置由用户指定时间窗口内DoI值(DDoI)的相对变化决定。通过一个移动的时间窗口对这个映射进行动画处理会导致数据项的位置随着时间做环形的移动,就像热系统一样,因此使用暖气流的隐喻。作者通过OECD国家经济合作和发展数据和股票市场数据两种使用场景来展示ThermalPlot技术的有效性。

继续阅读 »

LSTMVis:一个递归神经网络中隐含状态动态变化的可视分析工具 (LSTMVis: A Tool for Visual Analysis of Hidden State Dynamics in Recurrent Neural Networks)

图3:LSTMVis的用户界面

深度神经网络已经在计算视觉、自然语言处理等许多领域中取得了卓越的性能表现。深度神经网络能够自动地学习输入数据的隐含特征表示,用于相关任务。之所以称之为“隐含”特征表示,是因为这些特征表示难以以原始输入数据的形式表示出来,从而让使用者难以理解深度神经网络到底学习到了数据的什么信息。现有的研究中,有许多深度神经网络被广泛应用:标准的前馈神经网络、用于图片任务的卷积神经网络、以及用于对序列数据建模的递归神经网络等等。本文主要关注一类递归神经网络——长短期记忆(Long Short-Term Memory, LSTM)模型中隐含状态表示的可视化。

继续阅读 »

在平行坐标图中集成时间序列图 (Time-Series Plots Integrated in Parallel-Coordinates Displays)

图3:探索两变量间变化的延迟的关系

时变的高维数据是一类十分复杂的数据。例如,在模型模拟数据中,通常会预先设置一些(非时变的)输入参数的数值,然后模型模拟会产生一些输出属性,其中有些是非时变的,而有些是时变的。在这些数据中,领域专家通常需要研究输入参数与输出参数、输出参数之间的关系。此时,对时变高维数据进行可视化就变得非常重要了。本篇工作中提出了一种基于平行坐标图的焦点+上下文的可视化方式,通过在平行坐标图的相邻轴之间插入时间序列图来展示时变信息。

继续阅读 »

TimeArcs: 可视分析动态图中的波动 (TimeArcs: Visualizing Fluctuations in Dynamic Networks)

可视分析动态图中数据的波动模式,是个很有挑战性的问题。一般情况下,我们会选择small multiples形式或动画形式,来分析动态图中的变化模式。本文提出了新的可视化展示方式,TimeArcs,来分析动态图中的波动模式。 继续阅读 »

时间曲线: 通过折叠时间轴来表现时序数据的演化特征 (Time Curves: Folding Time to Visualize Patterns of Temporal Evolution in Data)

时间曲线示意图

在一个时序数据中,不同时间点的数据之间往往有一定的联系,譬如气温达到了近年来的最低,音乐旋律回到了最初的主题等等。而传统的线性时间轴,虽然能展示连续的数值变化,却无法表达这种具有时间跨度的数据关联。本文提出了一种直观通用的可视化方法,即所谓的时间曲线[1],通过折叠时间轴的方式来反映数据中的自相关性(self-similarity),以此来发掘数据演变的规律。

继续阅读 »

对偶邻接矩阵:稠密网络中的邻边聚类探索(Dual Adjacency Matrix: Exploring Link Groups in Dense Networks)

对关系网络图中的结点进行聚类是社群分析的一个重要方法,但对于特殊任务,比如寻找社群之间的公共结点,对边进行聚类则更加有效[1]。这篇EuroVis2015的文章[2]通过对偶邻接矩阵(Dual Adjacent Matrix)的方法,把结点邻接矩阵和边邻接矩阵合并到了一起,共同来进行网络图中的社群分析。

继续阅读 »

传感器网络中时序数据相似性探索与异常检测的可视分析 (Visual Analysis of Time-Series Similarities for Anomaly Detection in Sensor Networks)

智能电网(Smart Grid)连接城市的不同部位,将发电厂产生的电能输送到千家万户,对城市的正常运转至关重要。用户用电量的变化,以及偶尔发生的电网故障,都会导致电网上各处的负载发生变化。电网不同位置有不同的负载变化模式,会出现不同的异常状况。电网管理人员需要密切监视这些模式和异常。然而,对电网负载的分析较为复杂。首先,这种分析需要同时考虑多个角度,包括:电网上传感器的空间分布、拓扑关系以及每一个传感器上的负载变化,而通常的分析工具往往只考虑时变特征或者拓扑特性。此外,电网上的异常行为通常难以预知,因此没有特别好的自动方法可以检测所有异常,而异常检测很大程度上以来于专业人员的判断。在EuroVis 2014中,来自德国的研究者们设计了一个可视分析系统 [1],可以同时研究电网中的相似性和异常事件。

继续阅读 »

TimeBench:应用于时序数据可视分析的数据模型与软件库 (TimeBench: A Data Model and Software Library for Visual Analytics of Time-Oriented Data)

我们生活的信息时代被数字包围,记录我们一举一动的许多数据带有时间的信息,被称为与时间有关的数据,或时序数据(Time-oriented Data),常见的时序数据如电子医疗记录、网络流量记录等等。时间是一个十分特殊的维度,不同于普通的数值变量维度,时间中存在不同粒度的计时方法和循环方式,选择何种的粒度取决于数据分析的具体应用。

继续阅读 »