标签存档: 不确定性

多空间分辨率的时变气候集合模拟数据可视化 (Visualization of Time-Varying Weather Ensembles Across Multiple Resolutions)

系统的可视化界面

在气象相关的集合模拟中,量化模型中的不确定性是领域科学家们十分关心的问题,其对在现实世界中做出决策有十分重要的意义。现如今,随着计算能力的飞速提高,已有的模型模拟已经能够产生出时变的多分辨率的集合模拟数据集。因此而产生了领域科学家十分关心的两个问题:一是输入参数的敏感度信息,二是模型在不同分辨率下的精确程度。根据输入参数的敏感度信息,可以将更多的计算资源倾斜到那些对输出有更高影响上的输入变量上。同时,了解模型在不同分辨率下的精确程度,也能在节省存储和计算代价的前提下,得到足够优秀的模型输出结果。本文就针对WRF (Weather Research and Forecasting) 模型,根据其在不同参数不同分辨率下的输出,并在真实数据的辅助下,研究参数敏感度和空间分辨率精确度的关系。

继续阅读 »

对于稀疏采样的带有地理标签的社交媒体数据的交互式可视分析与探索 – Interactive Visual Discovering of Movement Patterns from Sparsely Sampled Geo-tagged Social Media Data

fig2_teaser

‘社交媒体’这个词现大家并不陌生,每天成千上万的人在使用着微博之类的社交媒体软件,各种新闻、心情、信息等都在网络上传播。随着智能手机的普及,发送带有GPS定位的微博数据变得更为容易,大量的带有地理标签的微博被发送、传播。它提供了一个丰富、广阔的可探索的信息空间 — 这对于以前以用户调研(Survey)为主要研究手段的人群移动研究,提供了一个前所未有的空间。今天我们就北京大学可视化与可视分析研究组在今年可视化顶级会议IEEE VIS 2015 发表的一篇可视分析方面的文章进行详细介绍 [1]。

继续阅读 »

考虑不确定性的微博信息检索方法 (An Uncertainty-Aware Approach for Exploratory Microblog Retrieval)

考虑不确定性的微博信息检索方法

微博在当代的网络生活中非常盛行,人们在上面议论着各种话题并发表他们的意见,其中蕴含的信息对社会学、媒体学等许多学科而言都是巨大的宝库。如何有效地发掘微博里的信息成为了一个重要的课题。而在以往的工作[2]中,信息检索都是以单条微博(post)为主体,其他因素如博主(user)和话题标签(hashtag)等都被看作过滤条件,来对微博进行筛选。但事实上,博主的受欢迎程度、话题热度等都会影响一条微博的重要性。只考虑微博相关性的检索往往无法满足用户的需求。另外,微博信息纷繁复杂,通过过滤器来改善检索结果往往十分低效。本文[1]提出了一种考虑不确定性的微博信息检索方法。该方法能结合多种因素改善检索结果,并通过不确定性的呈现,让用户能够在交互中有效地提高信息的质量。

继续阅读 »

基于采样数据的任务驱动可视化:让用户做出更正确且确定的决策 Sample-Oriented Task-Driven Visualizations: Allowing Users to Make Better, More Confident Decisions

屏幕快照 2015-05-29 下午11.23.04

随着数据的爆炸式增长,各行各业对数据分析的需求日益增大。但人们往往忽略了一个问题 — 他们正在分析的数据其实只是其数据全集中的一个采样。这样的忽略直接导致的结果就是:人们默认把采样数据当做全集数据进行分析,这样会导致几个问题,即采样的数据只是全集的子集,并不能完全代表全集的特征,这里具有一定的不确定性。尤其是在动态分析的数据集而言,这里的不确定性会增大。现有的可视化方法,例如boxplot盒图,它虽然可以展示出不确定性的分布,但是它仅仅是展示而已,对用户进一步的分析与决策判断的辅助效果并不明显。

继续阅读 »

等高线箱线图:一种描述系集模拟数据中特征集合不确定性的方法 (Contour Boxplots: A Method for Characterizing Uncertainty in Feature Sets from Simulation Ensembles)

teaser

系集模拟的研究方法在诸如气象学、计算流体力学等学科有着十分广泛的应用,其目的是为了了解模型以及参数的稳定性。已有的系集可视化方法通常直接将系集成员可视化,或者将诸如均值等聚集值可视化。然而,在很多情况下,系集模拟中令人感兴趣的部分通常不是数值场,而是其中的特征集合。这种特征集合通常为物理变量或者其衍生变量的阈值,从可视化的角度来看即为标量场的等高线。在这个工作中,作者从箱线图受到启发,从箱线图所表示的统计深度 (statistical depth) 类比到等高线的带深度 (contour band depth),提出了等高线箱线图 (Contour Boxplots),用于对系集等高线的不确定性进行描述。
继续阅读 »

基于贝叶斯模型平均的集合数值模拟预测不确定性的表征和可视化(Characterizing and Visualizing Predictive Uncertainty in Numerical Ensembles Through Bayesian Model Averaging)

集合数值模拟(Ensemble Numerical Simulation)是科学计算中的的常用手段。科研人员可以设定不同的模型参数,得到不同的模拟结果,进而分析模型的不确定性,改进模型等等。例如,在大气模式中,可以参数或边界条件进行调整,比较计算结果,进行决策和分析。集合模拟数据的可视化也是近年来可视化领域研究的热点问题,例如在今年的IEEE SciVis 2013会议中,至少有5篇文章和该问题有关。我们今天介绍的是其中Gosink等人[1]的工作,他们利用贝叶斯模型平均(Bayesian Model Averaging, BMA)的方法对集合模拟数据的不确定性进行表征和可视化。该方法可以通过集合模拟数据和少量的真值(例如稀疏的观测数据)作为输入,比较准确地预测真值(如图1),并评估预测不确定性(Predicative Uncertainty)。

71图1 某生物土壤修复实验中示踪物质的输入井和观测井,示踪物的浓度由集合模拟和观测数值共同获得

 

继续阅读 »