对基于聚类的集合天气预报分析的鲁棒性可视化 (Visualizing Confidence in Cluster-based Ensemble Weather Forecast Analyses)

在天气预报领域,其数据往往包含多个在不同模型或者模型初始条件下生成的成员,这些成员组成了一个集合。在这些集合数据中,气象学家经常需要确定某个区域内成员的主要走势,从而可以进行气象预测。随后的一些分析也建立在这些发现上。为了确定这种主要走势,人们通常使用聚类分析,在某些特定的区域将集合数据中类似的成员进行聚类。但是,集合聚类也存在者一些挑战。聚类结果高度依赖于某些参数,例如所选区域和聚类个数等,其往往对这些参数非常敏感。因此,我们能够多大程度信任聚类结果,这些聚类结果的在参数有小的改变时鲁棒性如何,这些都是需要解决的问题。针对这些问题,今年VAST的一篇文章[1],提出了一种可视分析的流程,使用一系列多个层面上的可视化来分析聚类结果在所选区域变动下的鲁棒性。

图1 可视分析流程图,包含多个部分,主要是鲁棒性可视化

图1 可视分析流程图,包含多个部分,主要是鲁棒性可视化

该方法的流程如图1所示,其包含多个部分,其中最核心的是鲁棒性可视化。在该工作中,作者使用了一个合成数据用于验证所提出的可视化,该集合数据包含51个成员(其中一个是ground truth参考成员),数据的平均值和标准差如图2所示。用户可以选择一个空间区域进行集合聚类,该工作所提出的方法可以提供可视化用于分析聚类结果的鲁棒性。

图2 文章所使用的合成集合数据,图中展示了所选区域的平均值和方差

图2 文章所使用的合成集合数据,图中展示了所选区域的平均值和方差

图3 Rand index图,展示不同平移下聚类之间的比较

图3 Rand index图,展示不同平移下聚类之间的比较

当所选区域发生变化时,例如在空间上有一些平移,我们需要知道聚类结果对这个区域改变的敏感性。因此,作者首先提出了一个整体的可视化,叫做Rand index(由Rand在1971年提出),来反映两种聚类的比较。如图3所示,index为1表示两种聚类完全相同,0则表示完全不同,从图中可以很明显看到所选区域在不同方向平移时聚类的变化。在此基础之上,用户可以对聚类鲁棒性在不同层面进行分析。

图4 以聚类为中心的视图 (cluster-centric view)

图4 以聚类为中心的视图 (cluster-centric view)

首先,在聚类的层面上,我们可以分析所得到的聚类的鲁棒性。方法提供了一个以聚类为中心的视图(cluster-centric view),并且与Rand index相连接。用户可以通过点击Rand index矩阵中的某一元素选择一种聚类,以聚类为中心的视图会显示所有可能的区域平移下的不同聚类。如图4所示,对于每一类,竖条的高度表示聚类中成员的个数,颜色表示参考聚类(所选区域上形成的聚类)的哪个类的哪个部分包含在所选择的聚类中,其实际上展示了参考聚类和所选聚类中共有的类的比例。

图5 (a) 表示每个成员的glyph图标 (b) 以成员为中心的视图 (member-centric view)

其次,在成员的层面上,我们可以分析每个成员被分配到特定集群的鲁棒性。方法提供了一个以成员为中心的视图(member-centric view)。在该视图中,每个成员使用一个glyph图标表示。如图5所示,该图标由一个内圈和包围内圈的饼图组成。内圈的颜色表示该成员的参考类,中间的数字表示成员的ID。饼图的每一个部分展示了该成员属于一个类的频率,按照由高到低逆时针排列。所有成员的图标按照成员的距离被组织在一起,形成了这个以成员为中心的视图,如图6所示。当用户点击某个图标的饼图时,一个矩阵视图会弹出,展示该成员所属类和所选区域平移之间的关系,矩阵视图的颜色表示该成员在所有聚类可能下的分布。通过双击饼图,所有具有类似聚类变化特征的成员图标上会弹出矩阵视图。图中表示4个成员在所选区域平移下具有类似的聚类变化特征。

图6 等值线概率图和覆盖其上的点画

最后,我们可以对每个聚类总体统计的鲁棒性的信息进行可视化。如图7所示,作者使用等值线概率图(contour probability plot)来展示集合的主要趋势。该图实际上是一个对概率场的叶片形式可视化(lobe visualization)。概率场中表示的是集合数据中指定的等值线阈值被超过的频率。除此之外,还有一个基于纹理的点画(stippling)图,用于展示一个类在属类变化情况下的差异,其实际上表示了所展示类的特征的不确定性。

总结来讲,这个工作从不同的层面上设计了有针对性的可视化形式,以聚类和独自的成员为中心,很好地展示了聚类结果随所选区域变化下的鲁棒性。文章所针对的聚类是通过k-means方法产生, 实际上也可以延伸到其他的确定性聚类算法上,例如层次聚类等。更进一步地,我们可以将该思想拓展到其他问题中,例如类似地在流场可视化中对特征提取和追踪过程中的鲁棒性进行可视化。

Reference

[1] Alexander Kumpf, Bianca Tost, Marlene Baumgart, Michael Riemer, Rüdiger Westermann, Marc Rautenhaus. Visualizing Confidence in Cluster-based Ensemble Weather Forecast Analyses. IEEE Transactions on Visualization and Computer Graphics, 24(1):109-119, 2018.

发表评论?

2 条评论。

  1. 微博分析所有功能都用不了了 🙁 🙁 🙁

发表评论


注意 - 你可以用以下 HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>