基于最长公共子序列的集合模拟向量场比较可视化


摘要


我们提出了一种基于最长公共子序列的(LCSS)的集合模拟向量场距离度量方法。主要思想是通过计算集合模拟迹线共同经过的数据块数来度量集合模拟向量场的距离,即在每个格点上,集合模拟向量场的相似度值为该格点出发的所有集合模拟迹线的最长公共子序列距离。与传统的度量方法(点对点欧氏距离以及动态时间规整距离)相比,我们提出的LCSS距离对异常值、数据缺失以及迹线时间步采样率比较鲁棒。此外,我们提出的方法可以在以更少的存储代价的情况下进行多尺度时间趋势分析,因为我们可以将LCSS算法的输入---LCSS序列码保存下来,以备复用,而LCSS序列码的存储开销比原始迹线的开销少很多。最后,本文使用了合成数据与真实模拟数据进行了方法评估与案例分析,结果表明我们提出的方法的鲁棒性和有效性。
关键词: 集合模拟可视化, 比较可视化, 最长公共子序列

Figures


图1. LCSS度量方法的流程图。首先,我们使用类似MapReduce的并行计算框架进行集合模拟迹线追踪。其次,在并行计算框架中将集合模拟迹线编码成LCSS序列码并进行LCSS距离度量。在每个空间格点上都可以得到一个LCSS相似度值与LCSS差异值,从而得到相似度场与差异场。再次,将编码成的LCSS序列码保存下来,以备后续复用。最后将LCSS相似度场与LCSS差异场可视化。




图2. 二维集合向量场中LCSS的编码与计算过程。集合成员Run 0的LCSS块系列为(0, 1, 2, 2, 3, 13, 14, 15, 16, 6, 7, 8, 9),而集合成员Run 1的LCSS块系列为(0, 1, 2, 2, 3, 4, 5, 6, -4, -3, -2, 8, 9)。



图3. (a) 使用与图(h)的差异场相同的块大小计算得到的LCSS相似度场; (b) 使用与图(e)的相似度场相同的块大小计算得到的LCSS差异场; 点对点方法生成的相似度场(c)与差异场(f); DTW方法生成的相似度场(d)和差异场(g); LCSS方法生成的相似度场(e)和差异场(h); 相似度场(e)和差异场(h)中的长方体框均表示高LCSS值的区域。

引用


Richen Liu, Hanqi Guo, Jiang Zhang, and Xiaoru Yuan. Comparative Visualization of Vector Field Ensembles Based on Longest Common Subsequence. In Proceedings of IEEE Pacific Visualization Symposium (PacificVis 2016), pages 96-103, Taipei, Apr. 19-22, 2016.

BibTeX

@Article{Liu2016,
Title     = {Comparative Visualization of Vector Field Ensembles Based on Longest Common Subsequence},
Author    = {Richen Liu, Hanqi Guo, Jiang Zhang, and Xiaoru Yuan},
Booktitle = {Proceedings of {IEEE} Pacific Visualization Symposium 2016},
Year      = {2016},
Pages     = {96--103},
Bibsource = {dblp computer science bibliography, http://dblp.org}
}