相似性探索:针对多角度气候模型的比较可视化工具 (SimilarityExplorer: A Visual Inter-Comparison Tool for Multifaceted Climate Data)

在气候数据分析中,相似性比较对研究不同气候模型之间存在共识和差异很重要。陆地生物圈模型等气候模型模拟了生态系统在时间和空间上的变化,比如光和作用,呼吸作用等。众所周知,交互可视化方法可以让研究者们更方便地浏览数据,从不同角度和粒度下对数据进行分析。但目前并不存在一个特别针对气候模型数据比较的可视化工具。在今天的EuroVis2014会议上,美国纽约大学的学者针对气候数据提出他们的工作SimilarityExplorer[1]。作者首先提出了针对气候数据不同角度下模型相似度的四种可视化分析需求,之后从这些需求出发,作者设计了满足这些需求的四种可视化任务设计指导。最后基于这些设计指导,作者开发了一个可视分析工具SimilarityExplorer,它结合了矩阵、散点图投影技术、平行坐标等多种可视化技术,重点从空间和时间这两个角度出发,对气候模型之间相似度做比较。由于这些设计指导和开发的系统都是基于与气候领域专家讨论的基础上得出的,所以这个系统的实用性和有效性都得到很好的验证。

多模型气候数据的示意图。数据的复杂性来源于它具有三维、时变、多模型、多变量的特征。

多模型气候数据的示意图。数据的复杂性来源于它具有三维、时变、多模型、多变量的特征。

多模型气候数据的研究有助于科学家掌握气候模拟的过程,理解气候变化的特征。对这类数据的可视化和分析难点源自于数据的复杂性,因为它们往往是三维、时变、多模型和多变量的,如何向数据分析者提供一个既支持对数据的全面概况,又具备灵活交互的可视分析工具,对研究人员是一项挑战。通常,领域专家在分析气候模型之间的相似度时,会独立地从空间或者时间出发,分析在某个时空维度上的相关性。比如,比较模型间整个亚洲地区所有时间点的平均值,或者模型间针对某个变量的全球月平均值。对于这类的查询和分析,以往领域专家使用一些诸如MATLAB或者R之类的常用脚本语言。然而在这个过程中,需要大量的手动参数的设置,并且分析对比过程需要很多次脚本运行结果,效率并不高。经过和领域专家半年的合作下,历经大量的讨论、设计和反馈,讨论出了
依照这些意图所开发系统SimilarityExplorer可以很有效地完成对气候模拟数据的模型间比较的任务。这些被归类出来的需求包括这四个:

  • 对于某个输出变量,领域专家希望识别出不同模型在时间或者空间维度上的相似度
  • 对于某些模型,领域专家希望知道哪些是相互类似的,这些类似出现在哪些地方、什么时间
  • 领域专家希望能联系时间和空间上的子区域以识别不同模型在其上的相似度
  • 领域专家希望知道原始的数据,由此验证他在使用系统时得出的一些结论和假设
  • 比较气候模型的空间相似度过程示意图。对于两个模型数据,只取它们在某个时间范围上的平均值,之后计算地理上的相关度

    比较气候模型的空间相似度过程示意图。对于两个模型数据,只取它们在某个时间范围上的平均值,之后计算地理上的相关度

    比较两个模型数据在时间维度上的相似度过程示意图。取某一特定地理区域上所有数据点的平均值,得到的时间序列之间的相关度。

    比较两个模型数据在时间维度上的相似度过程示意图。取某一特定地理区域上所有数据点的平均值,得到的时间序列之间的相关度。

    根据这些需求,作者设计出了四种不同的可视化任务。如表中所示,它们包括识别(Identify,识别不同模型在何处、何时的相似度)、比较(Compare,比较所有模型的相似程度)、关联(Associate,关联时间和空间对相似度的影响)和分布(Distribution,查看原始数据分布)。

    领域专家的需求以及可视化任务、可视交互工具的设计

    领域专家的需求以及可视化任务、可视交互工具的设计

    SimilarityExplorer的界面。

    SimilarityExplorer的界面。

    如图所示是SimilarityExplorer的界面。这个可视分析工具包含三个部分:控制台、相似度视窗和数据视窗。相似度视窗有两种不同的视图:矩阵视图和投影视图。矩阵视图展示两两模型之间的相关性,为了充分利用平面空间,以表示时间和空间两种角度下的相关性,矩阵的上三角中格点代表两个模型之间的时间相关性,下三角中个点代表两个模型之间的空间相关性。用户可以通过悬浮鼠标到感兴趣的模型对上查看具体的相关度值,或者通过设置控制台中的参数来改变显示的时间或者空间范围。投影视图用MDS投影方法把所有的模型投射到平面散点图上,相似的模型被投影到相近的位置,方便直接观察模型间的关系。

    矩阵视图,行列分别代表一个模型,格点内的是两个模型之间的空间/时间相似度。

    矩阵视图,行列分别代表一个模型,格点内的是两个模型之间的空间/时间相似度。

    用户从矩阵试图中选择一个格点即选中一对模型的空间相关度或者时间相关度。这会在相似度视窗中的小世界视图中添加一行序列。新加序列的某一项是这两个模型在所有预定的11个生态区中的相关性状况,如交互界面图中(d)子图所示。这样让领域专家对比不同区域对相关性的影响,分析产生异常的原因。

    数据视窗中包括平行坐标和折线图两种不同的视图。平行坐标的每个轴代表模型,折线在轴上的位置代表某个地理区域在这个模型上的取值,由此可以比较模型在不同区域上的实际取值,并且发现一些数据分布或者聚集的特性。折线图把需要比较的模型在某个时间范围上变化集成到同一个坐标中,便于做比较。

    比较不同模型下变量GPP在冬、夏两个季节内的相似度

    比较不同模型下变量GPP在冬、夏两个季节内的相似度

    在这个工作中作者请三位领域专家使用他们的SimilarityExplorer一个月,有了一些发现。比如在上图中,领域专家想分析变量GPP(Gross Primary Productivity)在某些地域于夏季和冬季的相关程度。图中的投影视图显示,两对模型CLM和CLM4VIC,LPJ和BIOME之间的相似度在冬季和夏季各自不一,前一对总是相近,但是后一对在冬季不如夏季相似。领域专家认为投影视图中坐标轴没有含义让他们一开始不太习惯,但是他们发现可以从中得到所有模型之间的相关性,这种新的方法他们很喜欢。领域专家的反馈显示SimilarityExplorer能有效地帮助他们分析和比较气候模型输出数据

    总结来说,这个工作在与领域专家的讨论中,把对于从时间和空间的角度比较多模型气候数据的具体需求明确下来,针对领域专家的需求,作者设计了对应的可视化任务,并且开发出可视分析工具SimilarityExplorer,有效帮助领域专家分析比较复杂气候数据。我们在设计可视化工具时可以参考这个工作带来的启示,尝试多和用户、领域专家沟通协作,并且多从使用者的角度考虑系统的功能和交互方式,让自己的研究工作专注与解决某个实际的问题。

    参考文献
    [1] SimilarityExplorer: A Visual Inter-Comparison Tool for Multifaceted Climate Data. Jorge Poco, Aritra Dasgupta, Yaxing Wei, William Hargrove, Christopher Schwalm, Robert Cook, Enrico Bertini, and Claudio Silva. Eurographics Conference on Visualization (EuroVis), 33(3):341-350, 2014.

    评论关闭。