标签存档: 时间序列分析

草图的语义:时间序列可视查询系统的灵活性 (The Semantics of Sketch: Flexibility In Visual Query Systems For Time Series Data)

草图允许分析者指定复杂和自由的兴趣模式。可视化查询系统可以利用草图在大型数据集中找到这些感兴趣的模式。然而,草图是不明确的:同一张图可能代表大量潜在的查询。在这项工作中,我们调查了这些含糊之处,因为它们适用于可视查询系统的时间序列数据。我们定义了一类“不变量”——分析者在执行基于草图的查询时希望忽略的时间序列的属性。我们提出了一个众包的研究结果,表明这些不变量是人们如何评价草图和目标之间的匹配强度的关键组成部分。我们采用了一些时间序列匹配算法来支持草图中的不变量。最后,依赖于这些不变量,我们提出了一个基于Web部署的草图可视化查询系统原型。我们将原型应用于金融、数字人文和政治科学的数据。

继续阅读 »

利用可视分析进行时间序列模型选择(Visual Analytics for Model Selection in Time Series Analysis)

时间序列分析在医疗、气象、金融等领域非常常用。常见的分析任务包括:判断一个变量是否存在明显的随时间上升或下降趋势,根据过去的变化趋势预测未来的值。为了完成这些分析任务,人们发展了许多时间序列模型,包括时间域模型和频率域模型。本文将要提到的SARIMA模型就是一种常用的时间域模型。该模型有7个超参数需要分析人员结合自己的经验手动指定,而指定这些参数的过程称为模型选择。统计学家发展了一套标准的适用于SARIMA模型的模型选择流程,称为Box-Jenkins方法。现有的常用分析软件(例如R)已经支持基于Box-Jenkins方法的模型选择流程,然而该过程需要分析人员手动输入多条命令,在不同的显示图表之间切换,并且手动比较多个模型。进行这些操作并不方便。本文的作者基于R中已有的算法,使用Java重新设计了一个支持模型选择的可视分析界面TiMoVA[1](Time series analysis, Model selection, and VA),能够支持更流畅的模型选择流程。

继续阅读 »