高维可视化在科学数据中的应用

简介

科学家在进行实验观测的时候,常常需要从多个方面收集实验对象的相关信息,以便后续的研究分析。科学数据中因而包含了大量的高维信息,需要利用有效的手段来处理。为此,我们将高维数据可视化方法与科学数据相结合,一方面提出了许多新颖的技术,另一方面也产生了很多优秀的应用案例。


标量场中的高维数据分析

三维标量场是科学数据中的常见类型。它包含一个体数据,其中的每个数据点都有一系列不同的属性。在绘制体数据时,我们往往需要通过传递函数来确定数据的颜色与不透明度。然而,高维传递函数的设计在实际应用中是一个巨大的挑战。我们通过结合散点图和平行坐标,提出了一种新颖的高维传递函数设计方案[2,3]。其中,用户可以在平行坐标中进行数据刷选,并将相应的颜色映射到空间视图里。反过来,用户在空间视图的刷选也会反映在属性空间中。这不但能帮助用户分析数据的属性分布,也能将空间信息和维度信息紧密结合起来,帮助用户理解数据的语义。


流场中的高维数据分析

流场是另一类重要的科学数据。它能帮助科学家揭示海洋和大气中的流体运动规律,解释复杂的自然现象如污染物传播、二氧化碳排放等等。而在流场中,我们常常模拟例子的运动轨迹,并提取出迹线(pathline)数据。每条迹线都有多个不同的属性,然而迹线的可视化技术很少考虑到属性信息的处理。针对这个问题,我们提出了基于拉格朗日方法的属性空间投影(Lagrangian-based Attribute Space Projection, LASP)[4],以帮助用户分析迹线在属性空间的分布与联系。

在LASP里面,我们将每条迹线看作是特征空间中的一个点。迹线之间通过累计每个时间点、每个属性上的差异值来计算距离。有了迹线距离,我们就可以用一个投影图来展示所有迹线的分布以及它们之间的关系(如上图(a))。此外,我们利用散点图矩阵来展示迹线在各个属性上的具体分布(如上图(b))。用户可以通过刷选和链接等交互来关联属性与空间信息。

然而,用户不能只依靠交互来探索数据,我们需要提供更高效的数据特征提取算法,来为用户的探索指明方向。为此,我们提出了FLDA[5],一种新颖的流场特征提取方法。

该方法是基于隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型,一种常用在文本分析领域的话题提取算法。我们将每条迹线看作一篇文章,将不同的属性看作文章中的词语,并利用LDA算法训练出若干个主题。其中每个主题包含了一组特征相似的迹线,如左上图所示。用户也可以观察每个主题中的空间以及属性分布,如右上图所示。相比于其他方法,我们的方法对迹线进行了模糊聚类,具有较好的容错性和可解释性,而且在聚类的同时能够将属性值组织成有具体含义的特征(即主题)。最后,我们通过真实数据检验了该方法,并证实了方法在特征提取方面的有效性。


引用

  1. Hanqi Guo, and Xiaoru Yuan. Design and Application of PKU Scientific Visualization System. In Proceedings of National Annual Conference on High Performance Computing (HPC China 2013), pages 551-558, Guilin, China, Oct. 27 - Oct. 31, 2013. (in Chinese).
    | 文章: pdf (1.3 MB) |
  2. Hanqi Guo, He Xiao, and Xiaoru Yuan. Scalable Multivariate Volume Visualization and Analysis based on Dimension Projection and Parallel Coordinates. IEEE Transactions on Visualization and Computer Graphics, 18(9):1397-1410, 2012.
    | 文章: pdf (860 KB ) |
  3. Hanqi Guo, He Xiao, and Xiaoru Yuan. Multi-Dimensional Transfer Function Design based on Flexible Dimension Projection Embedded in Parallel Coordinates. In proceedings of IEEE Pacific Visualization Symposium (PacificVis 2011), pages 19-26, Hong Kong, March. 1-4, 2011.
    | 文章: pdf (1.13 MB) | 视频: mp4 (4.93 MB) |
  4. Hanqi Guo, Fan Hong, Qingya Shu, Jiang Zhang, Jian Huang, and Xiaoru Yuan. Scalable Lagrangian-based Attribute Space Projection for Multivariate Unsteady Flow Data. In Proceedings of IEEE Pacific Visualization Symposium (PacificVis 2014), pages 33-40, Yokohama, Japan, Mar. 4-7, 2014.
    | 文章: pdf (1.6 MB) | 视频: mp4 (5.1 MB) |
  5. Fan Hong, Chufan Lai, Hanqi Guo, Enya Shen, Xiaoru Yuan, Sikun Li. FLDA: Latent Dirichlet Allocation Based Unsteady Flow Analysis. IEEE Transactions on Visualization and Computer Graphics (SciVis'14), 20(12):2545-2554, 2014.
    | 文章: pdf (4.5 MB) |

  6. © 北京大学可视化与可视分析研究组 2008-2016