针对天气预报集合模拟数据的交互式可视化框架 (An Interactive Framework for Visualization of Weather Forecast Ensembles)

集合(ensemble)模拟数据是科学可视化中的一类重要研究对象。特别是针对气象学这一特定领域。在气象学领域,气象学家经常会使用数值天气预报模型来生成集合模拟数据。通过扰动初始条件或者使用不同的预测模型公式,集合模拟数据通常由一系列数据成员组成,每一个成员都是一个标量或者矢量场。由于集合数据往往由大量的数据成员组成,并且具有较高的复杂度,研究者开始广泛使用可视化方法来评估集合数据中的固有差异和不确定性,这也成为了一个重要的研究方法。

图1 意大利面条图 (http://www.cpc.ncep.noaa.gov/products/predictions/threats/briefs/hgtP1.html)

图1 意大利面条图 (http://www.cpc.ncep.noaa.gov/products/predictions/threats/briefs/hgtP1.html)

目前比较流行的方法是使用一种称为意大利面条图(spaghetti plot)的可视化工具,如图1所示,针对标量集合数据,在给定一个isovalue的情况下,同时将所有成员的等值线(isocontour)绘制出来。但是,当需要针对多个isovalue进行分析时,绘制大规模的集合成员的等值线会造成明显的视觉遮挡,难以进行有效分析。尽管有一些诸如等值线盒图(contour box plot)[1]和等值线差异图(contour variability plot)[2]等改进方法,如何对集合模拟数据的差异和不确定性进行动态地交互式分析仍然比较是一个需要解决的问题。因此,今年SciVis上的一篇文章[3]提出了一种针对集合等值线不确定性可视化的交互式框架,利用高密度聚类算法研究集合等值线的分布行为,同时设计了针对性的可视化视图,支持用户进行交互式的焦点上下文(focus+context)的探索。

图2 核密度估计公式

图2 核密度估计公式

图3 使用一个阈值定义的上水平集

图3 使用一个阈值定义的上水平集

图4 高密度聚类

图4 高密度聚类

首先介绍针对集合等高线的高密度聚类算法,其目的是在给定一个isovalue的情况下对集合等高线进行聚类。对每一个集合成员标量场,首先计算一个带符号的距离变换场(signed distance transform)。该变换场的每一个格点记录了与相应成员的等值线的(带符号)最近距离。每个带符号的距离变换场可以看作为一个m维矢量空间的点(m是标量场的格点数),之后使用主成分分析PCA对这些高维点进行降维处理。接着,对这些点使用核密度估计(kernel density estimator, KDE),公式如图2所示。KDE的结果是一个多模态分布,每一个模态对应着一个高密度等值线聚类。在此基础上,使用一个阈值定义一个上水平集,如图3公式所示。图4(a)给出了一个在给定上水平集下的高密度聚类。这些高密度聚类和其之间的连接可以使用图4(b)中的系统树图表示(图中是在整个密度范围之内的到的聚类)。

图5 对高密度聚类结果进行可视化的模态图

图5 对高密度聚类结果进行可视化的模态图

图6 原始的意大利面条图和简化后的意大利面条图

图6 原始的意大利面条图和简化后的意大利面条图

高密度聚类算法的结果使用模态图(mode plot)来进行可视化,如图5右所示(图5左为相应的集合等值线)。模态图使用了同心圆的形式来映射模态的层次结构和其之间的连接关系。其思想是对每个模态创建一个同心圆,然后,在上水平集之下,如果两个模态是相连的,那么同样连接对应的同心圆。除此之外,系统还提出了一种简化的意大利面条图,可以针对多个isovalue,在意大利面条图上绘制每个isovalue的具有代表性的等值线,从而可以让用户选择感兴趣的isovalue进行探索。图6展示了原始的意大利面条图和简化后的意大利面条图。

图7 模态选择:从左至右分别为主要模态,低置信度的模态,不太可能的模态,以及异常值模态

图7 模态选择:从左至右分别为主要模态,低置信度的模态,不太可能的模态,以及异常值模态

图8 (a) 高密度(最大密度的0.6)过滤;(b) 排名前20%等值线的过滤

图8 (a) 高密度(最大密度的0.6)过滤;(b) 排名前20%等值线的过滤

结合模态图和意大利面条图,系统提供了一系列交互操作来探索集合等值线的不确定性和差异性。第一种是模态选择,用户可以在模态图上选择感兴趣的代表诸如主流趋势和异常值的模态,如图7所示,并对其进一步集中分析。第二种是高密度过滤。用户可以在高密度聚类中选择任意密度水平的等值线。如图8(a)所示,在模态图中,所选的聚类会被表示为部分带色的同心圆,在意大利面条图中,所选等值线会被高亮而其他等值线会变灰淡出。第三种交互是模态百分位过滤。由于每个模态聚类中的等值线可以依据其密度值进行排名,用户可以指定一个百分位来选择高排名的等值线,例如图8(b)中的前20%的等值线。另外,系统还支持焦点上下文探索。用户可以在模态图上刷选一个字区域,系统会在该区域内重新计算高密度聚类,以进行局部分析。

图9 针对拥有26个成员的天气预报集合模拟数据的案例分析

图9 针对拥有26个成员的天气预报集合模拟数据的案例分析

图9展示了一个系统的案例分析。该案例的集合模拟数据包含26个成员,使用位势高度场的等高线进行分析。如图6所示,从简化后的意大利面条图上,作者选择了两个isovalue: 5790米和5880米。对于第一个isovalue,图9(a)显示有两个比较强的模态聚类(红色和绿色),还有一些异常值。其中,四个异常值和红色模态相连,另两个是隔离开的。通过设置高密度过滤,红色和绿色模态中的高密度等值线被选中(图9(b))。图9(c)过滤出了隔离开的异常值。通过进一步刷选一个小的区域,重聚类结果显示有一个主要的模态(红色)和一个异常值(图9(d))。由于设置了两个异常值,实际上还有一个异常值隐藏在了主模态中,如图9(e)所示。通过增加异常值的数目,可以看到更多的异常值从主模态中隔离出来了(图9(f))。对于另一个isovalue,图9(g)中出现了两个模态聚类,其中红色的更强。高密度过滤显示红色是主要的模态(图9(h))。图9(i)展示了排名前10%的等值线,从这个视图中可以清楚地检查两个聚类的等值线的位置差异。

References

[1] Ross T. Whitaker, Mahsa Mirzargar, and Robert M. Kirby. Contour boxplots: A Method for Characterizing Uncertainty in Feature Sets from Simulation Ensembles. IEEE Transactions on Visualization and Computer Graphics, 19(12):2713–2722, 2013.

[2] Florian Ferstl, Mathias Kanzler, Marc Rautenhaus, and Rüdiger Westermann. Visual Analysis of Spatial Variability and Global Correlations in Ensembles of Iso-Contours. Comput. Graph. Forum, 35(3):221-230, 2016.

[3] Bo Ma and Alireza Entezari. An Interactive Framework for Visualization of Weather Forecast Ensembles. IEEE Transactions on Visualization and Computer Graphics (SciVis’18), 2018.

发表评论?

0 条评论。

发表评论


注意 - 你可以用以下 HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>