IEEE PacificVis 2021 时序和时空数据专题(Temporal and Spatio-Temporal Data)

IEEE PacificVis 2021 时序和时空数据专题(Temporal and Spatio-Temporal Data)共报告四个工作,分别是可视化时间不确定性的分类、时间相关的二维标量场集合分析、动静混合的多维时序数据分析以及集合数据的时空趋势可视分析。

可视化时间不确定性:分类和对系统评价的呼吁(Visualising Temporal Uncertainty: A Taxonomy and Call for Systematic Evaluation)

对数据不确定性的可视化有助于对数据、信息的全局掌握,以及做出合理的决策。因此作者选择对时间不确定性的可视化方法进行收集和分析,提出了一种分类方法,同时呼吁更多的研究者们参与其中,来形成一个完善的对于不确定性的可视化方法的评价体系。

数据的来源包括一个在线的可视化收集网站:Uncertainty Vis Browser[1],和通过Google关键词搜索得到的结果,截止发表已收集的时间不确定性的可视化共有52个。

对于不同可视化方法的比较分类,作者主要从两个角度考察,第一个是该可视化方法所需要的用户专业知识程度,第二个是可视化传递不确定性的程度。对于用户的专业知识要求,不用于以往的二类分类方法,作者提出了两个参数使得在该维度上不同方法可以细。这两个参数分别,一个是原始文章中作者提到的用户知识要求,另一个是在文章中用户实验的被试的专业水平。两者中应该选择较高的一个专业知识需求作为该可视化方法真正的对于用户的要求。当两者都没有在文章中提及时,作者会使用常识对可视化方法进行判断。对于可视化传递不确定性的程度,同样主要通过两两方法之间的比较排序。由此,作者将52个可视化绘制为一个散点图。


图1: 将52个时间不确定性可视化依用户知识水平和不确定性程度两个维度排布

从结果中,作者观察到可视化研究者们更倾向于使用不传递数据不确定性的可视化方法,无论所针对用户的专业水平,即使数据中包含着明显的不确定性。作者认为这样的倾向性应当在可视化研究中被纠正过来,这就需要更多的人来参与建设起一个完善的不确定性可视化方法的评估系统。

扩展经验正交函数支持时间相关的二维标量场集合分析(An Extension of Empirical Orthogonal Functions for the Analysis of Time-Dependent 2D Scalar Field Ensembles)

现实中的很多现象没有显式表示方式,需要通过数学模型来进行数值模拟。模拟结果依赖于初始条件和参数的选择,且通常细微的不同会导致巨大的模拟结果变化。为了分析这种不确定性,研究者采样参数空间,生成模拟结果的集合。随着集合规模的增大,分析集合模拟数据变得困难。一种常见的方法是分析集合模拟的统计数值,例如通过经验正交函数来分析时空数据的主要变化。然而该方法主要用于分析单个维度的变化,如时间维度。该工作扩展经验正交函数方法以支持分析两个维度(时间、模拟)的变化。

传统的一维(时间)经验正交函数方法,假设有m个函数\( f^{(i)}(\textbf{x}), i = 1, …, m \)。每个函数\( f^{(i)} \)在二维流形的n个离散格点上定义了值 \( \textbf{f}(i) = (f^{(i)}(1), \ldots, f^{(i)}(n)) \),则函数在连续流形上的定义可以由一组与格点有关的基底函数\( p^{(1)}, \ldots, p^{(n)} \)以及格点上的原始值的乘积之和来表示。经验正交函数的目的是找到一组基底函数\( \textbf{g}^{(1)}, \ldots, \textbf{g}^{(j)}, \ldots, \textbf{g}^{(l)} \)来近似表示\( \textbf{f}^{(i)}(\textbf{x}) = \alpha^{(i)}_{1}\textbf{g}^{(1)} + \ldots + \alpha^{(i)}_{l}\textbf{g}^{(l)} \)。\( \textbf{g}^{(j)} \) 本身也可以用相同的插值的基底函数\( p^{(1)}, \ldots, p^{(n)} \) 来表示,于是近似函数表示与原始函数的平方误差可以表示为:

当插值函数定义成格点邻域的函数值等于格点值,矩阵\( \textbf{W} \)为对角矩阵,对角线的每个值对应格点邻域的面积。优化过程等价于寻找矩阵S的前l大特征值对应的特征向量\( \textbf{W}^{(1/2)}\textbf{g}^{(j)} \)。由于该方法可视为PCA的推广形式,该方法也被称为地理加权的PCA。

该工作考虑将经验正交函数方法推广至二维形式(时间和集合模拟)。假设有\( \eta * \tau \)个函数\( f^{(e,t)} \),直接的推广方式为寻找两组基底函数\( \textbf{g}^{(j)} \) 和\( \textbf{h}^{(j)} \),和对应的系数,使得近似函数和原函数的平方误差最小:

发现目标函数等价于求解\( \textbf{S}_e \)的前l大特征值对应特征向量\( \textbf{W}^{1/2}\textbf{g}^{(j)} \)和\( \textbf{S}_t \)的前l大特征值对应特征向量\( \textbf{W}^{1/2}\textbf{h}^{(j)} \),而对应的系数为\( \alpha^{(e)}_j = \frac{{\textbf{g}^{(j)}}^T\textbf{W}\overline{\textbf{f}^{(e,\cdot)}}}{{\textbf{g}^{(j)}}^T\textbf{W}\textbf{g}^{(j)}} \)和\( \beta^{(t)}_j = \frac{{\textbf{h}^{(j)}}^T\textbf{W}\overline{\textbf{h}^{(\cdot,t)}}}{{\textbf{h}^{(j)}}^T\textbf{W}\textbf{h}^{(j)}} \)。从结果可以发现,优化问题被拆解为2个特征值求解问题,其中一个是关于每个集合模拟的时间平均,另一个是关于每个时间步的所有集合模拟的平均,因此将\( \textbf{g}^{(j)} \)和\( \textbf{h}^{(j)} \)分别称为集合经验正交函数和时间经验正交函数,分别表现了集合维度的模式和时间维度的模式。

该工作将集合经验函数和时间经验函数应用于2个关于欧洲冬季月均海平面气压数据集。该工作作者关注于相比于平均值的变化,因此将所有集合模拟结果减去了平均值后,计算集合经验正交函数、时间经验正交函数以及它们的系数。在数据集CERA-20C中,前2个时间经验正交函数分别表现了预期的影响欧洲冬季海平面气压的两种模式,北大西洋涛动(NAO)和东大西洋(EA)模式,且数值范围较广,在正负450Pa之间。相比之下,集合经验正交函数的方差较小。该集合模拟数据生成时,限制在真实值附近,实验结果符合数据集生成过程。而在没有施加限制的数据集MPI-GE中,NAO和EA模式在集合经验正交函数中更为明显。


图2: CERA-20C的前2个时间经验正交函数

图3: CERA-20C的前2个集合经验正交函数

NetScatter: 通过混合动态和静态变量关系的多维时序数据可视分析(NetScatter: Visual analytics of multivariate time series with a hybrid of dynamic and static variable relationships)

该工作[2] 的主要贡献有如下三点:1> 设计用于展示成对变量的在两个时间步上的时序关系的Net scatterplot(见图4); 2> 提出Net scatterplot的视觉特征(见图5),比如趋势和相关关系; 3> 基于Net scatterplot设计多维时序数据的可视化原型系统。


图4: 方法总览

该工作使用的方法(见图4)可以分为三个阶段。首先是数据的预处理,将数据进行正规化。其次是生成Net scatterplot,使用leader binning [3]方法对向量进行采样以减少视觉混乱,并计算视觉特征的定量值。最后是基于Net scatterplot的视觉特征值(见图5),使用PCA和UMAP的降维方法将成对变量在所有相邻时间步的关系投影到2维平面。


图5:Net scatterplot的视觉特征

为了验证可视化设计的有效性,作者使用美国就业数据集作为案例研究(结果见图6)。从PCA视图中可以看到一条“长尾”,它们表示的是2020年3月至4月期间COVID-19对就业的影响。进一步分析可以得到,离密集区域越远的点,下降的幅度越大。而从UMAP视图中可以看出,2020年3月至4月期间的Net scatterplot的分布非常集中,意味着成对变量随时间的变化比较类似,而其他时间段分布的比较分散。


图6:案例研究

以北大西洋振荡为例,对时间相关集合数据集的时空趋势进行可视化分析(Visual Analysis of Spatio-Temporal Trends in Time-Dependent Ensemble Data Sets on the Example of the North Atlantic Oscillation)

北大西洋振荡(the North Atlantic Oscillation,NAO)会影响欧洲冬天的气候。由于全球气候的变化,导致NAO的两个气压中心的位置会发生变化。该工作希望研究振荡现象的时空变化趋势,提取并展示气压中心地带的变化轨迹。

图7:NAO对冬季欧洲天气的影响.
https://www.britannica.com/science/North-Atlantic-Oscillation

该工作使用的方法流程如图所示。集合数据包含时间序列中的标量场数据。首先,通过滑动窗口划分不同阶段的标量场数据;在每一个窗口内,为每一个成员,通过经验正交函数分解(empirical orthogonal function, EOF)计算其标量场数据的代表场数据;使用信任驻点(confident critical points)计算代表场数据的概率驻点;根据极大值、极小值、鞍点等类型,将每个场数据区域内的概率驻点合并为连通区域;根据驻点的置信度,计算连通区域的质心;连接不同时间窗口内场数据区域的质心,形成运动轨迹。


图8: 轨迹提取流程

如下图,在50年的时间窗口下,该工作使用多个模拟条件下的集合数据,提取出冰岛低压(Icelandic Low)和亚速尔高压(Azores High)的轨迹变化。

图9:模拟数据中,两个气压中心的轨迹变化

参考文献:

[1] A. Jena, U. Engelke, T. Dwyer, V. Raiamanickam, and C. Paris. Uncertainty Visualisation: An Interactive Visual Survey. In Proceedings of IEEE Pacific Visualization Symposium, 2020.

[2] Bao D.Q. Nguyen, Rattikorn Hewett, and Tommy Dang. NetScatter: Visual analytics of multivariate time series with a hybrid of dynamic and static variable relationships. In Proceedings of 2021 IEEE Pacific Visualization Symposium, Accepted, 2021.

[3] Tuan Nhon Dang and Leland Wilkinson. Scagexplorer: Exploring scatterplots by their scagnostics. In Proceedings of IEEE Pacific Visualization Symposium, pp. 73–80, 2014.

[4] Dominik Vietinghoff, Christian Heine, Michael Böttinger, Nicola Maher, Johann Jungclaus, and Gerik Scheuermann. Visual Analysis of Spatio-Temporal Trends in Time-Dependent Ensemble Data Sets on the Example of the North Atlantic Oscillation. In Proceedings of
IEEE Pacific Visualization Symposium, 2021.

评论关闭。