作者存档: Fan Hong

一种基于三维卷积稀疏编码的体渲染智能系统方案 (An Intelligent System Approach for Probabilistic Volume Rendering using Hierarchical 3D Convolutional Sparse Coding)

图8:Kiwi数据和Aneurysm数据的体渲染结果,分别为[2]、[3]和本文方法

直接体渲染是一种表现三维体数据的强大可视化手段。过去数十年间,研究者们进行了大量的研究,来提高体渲染的速度与质量。其中,传递函数的设计是影响这两个指标的一个重要因素。传递函数将体素的值映射到诸如颜色、不透明度、可见性等光学性质。然而,要设计一个好的传递函数通常面临着很大的困难,对非专业使用者更是如此。绝大多数传递函数设计的方法都依赖用户大量的交互,用户需要根据数据的统计特征,通过不断试错,以求达到好的效果。这里的统计特征通常是数据某些属性的直方图。在本文中,作者提出了一种基于机器学习方法:三维卷积稀疏编码,能对体素进行精确分类,从而得到优秀的体渲染结果。同时,基于智能系统的交互方式,能让用户通过直观的输入,来完成传递函数设计过程。

继续阅读 »

分析深度生成模型的训练过程 (Analyzing the Training Processes of Deep Generative Models)

DGMTracker系统界面

深度生成模型是针对非监督学习和半监督学习的一种强有力的解决方案。通过深度生成模型,深度学习在没有外部数据标签或者带标签数据集过小的情况下仍然能继续工作。与其他的深度模型,比如卷积神经网络,更强有力的深度生成模型,也意味着其训练过程对训练者的要求更高。一方面,生成模型既有着确定性的函数,又包含随机变量;另一方面,生成模型是一种自上而下不断生成细节的过程,而诸如卷积神经网络则是从细节中不断提取高层特征的自底向上的过程。综合这两方面,如果理解深度生成模型的训练过程,以及如何对其过程进行诊断就变得尤其重要。本文就考虑用可视分析的手段来帮着这个分析过程。

继续阅读 »

LSTMVis:一个递归神经网络中隐含状态动态变化的可视分析工具 (LSTMVis: A Tool for Visual Analysis of Hidden State Dynamics in Recurrent Neural Networks)

图3:LSTMVis的用户界面

深度神经网络已经在计算视觉、自然语言处理等许多领域中取得了卓越的性能表现。深度神经网络能够自动地学习输入数据的隐含特征表示,用于相关任务。之所以称之为“隐含”特征表示,是因为这些特征表示难以以原始输入数据的形式表示出来,从而让使用者难以理解深度神经网络到底学习到了数据的什么信息。现有的研究中,有许多深度神经网络被广泛应用:标准的前馈神经网络、用于图片任务的卷积神经网络、以及用于对序列数据建模的递归神经网络等等。本文主要关注一类递归神经网络——长短期记忆(Long Short-Term Memory, LSTM)模型中隐含状态表示的可视化。

继续阅读 »

对人工神经网络的隐式行为进行可视化 (Visualizing the Hidden Activity of Artificial Neural Networks)

图3:训练前后MLP最后一层数据表示的投影图

在许多机器学习任务中,人工神经网络尤其是近些年发展起来的深度学习网络,已经取得了十分瞩目的结果。然而,以前研究者往往将神经网络的内部行为当作黑盒来看待,神经网络到底学习到了什么并不了解。近些年来,研究者们逐渐开始关注这一问题,并通过了解其内部行为来帮助优化模型。而这篇工作则是从可视化的角度出发来对待这个问题。

继续阅读 »

时变集合模拟数据中的趋势特征可视分析 (Visual Trends Analysis in Time-Varying Ensembles)

图3:趋势图的构建

集合模拟数据是现今科学可视化领域中的重要挑战之一。对于同一个物理现象,使用多个物理模型或者同一模型多组不同参数进行模拟,产生的一组模拟结果就称之为集合模拟数据,每个单独的结果称之为集合成员。对集合模拟数据的研究,一方面可以对各个结果之间的相似性和相异性进行分析,另一方面可以用于进行模型参数的优化。而这个工作主要关注的对应两个问题就是:时变集合模拟数据中趋势特征和异常成员的识别,以及和参数空间的结合探索。

继续阅读 »

区间似然树:一种可视探索不确定性数据集的紧凑高效的表示方法 (Range Likelihood Tree: A Compact and Effective Representation for Visual Exploration of Uncertain Data Sets)

本文针对的数据是具有不确定性的标量场数据。我们知道,普通的标量场数据在一个空间格点上只会确定的取一个数值。而在具有不确定性的标量场数据中,一个空间格点会以一定概率分布取不同的标量值。因此,这种数据也被称为概率分布场数据。这类数据在原有的空间维度上新增加了一个分布维度,因此对这类数据的可视化和分析会十分困难。已有的方法或者基于一些统计指标对概率分布进行约减,或者通过定义概率分布间的相似性来进行分析。而本文则提出使用累积概率来进行分析。

继续阅读 »

IEEE Pacific Visualization Symposium 2017 – Day 1

Bongshin Lee对PacificVis近十年的情况进行了可视化与总结

今天是IEEE PacificVis会议正式日程的第一天。首先进行的是大会的开幕式。大会主席Bongshin Lee和Jinwook Seo欢迎各位与会者,并介绍了这次会议的参与情况。今年共有来自19个国家的133人参与,其中来自大陆的可视化研究者有22名。接着,论文、短论文、海报张贴与storytelling竞赛的主席分别对各自部分的参与、评审以及接收情况进行了介绍。本次会议共接受论文29篇,分数均在3.5及以上。我们实验室陆旻同学的论文《Interaction+: Interaction Enhancement for Web-based Visualizations》被全文接收。图可视化主题在今年所接受论文、海报张贴中都有着很大的比例。

继续阅读 »

分布导向的喷气发动机模拟的原位分析和可视化 (In Situ Distribution Guided Analysis and Visualization of Transonic Jet Engine Simulations)

图9:低压强和高熵值不确定等值面可视化

这篇文章关注的是一个科学应用领域的问题:喷气发动机的旋转失速 (rotating stall) 现象。喷气发动机中的压气机在运转过程中,可能由于气流的不稳定,阻碍压气机中叶片的旋转,从而导致叶片逐渐停止转动,发动机失去动力。这是一种十分危险的现象。领域科学家们希望借由模拟来研究旋转失速这种现象,尤其是希望能发现这种现象的早期征兆,从而预防其发生。最近,NASA开发了名叫TURBO的模型,能够以非常高的精度来模拟压气机的行为,从而能够极大地帮助领域专家对旋转失速的研究。然而,其模型的高精度特性也使得产生的数据量非常巨大,存储所有数据带来的I/O花费变得难以承受,从而导致传统的后处理 (post-processing) 分析难以直接应用。基于这些背景,本文提出了分布 (distribution) 数据导向的原位分析和可视化框架,用以解决这个问题。这篇文章来自于今年的IEEE VIS科学可视化部分,并获得了最佳论文的提名奖。

继续阅读 »

多空间分辨率的时变气候集合模拟数据可视化 (Visualization of Time-Varying Weather Ensembles Across Multiple Resolutions)

系统的可视化界面

在气象相关的集合模拟中,量化模型中的不确定性是领域科学家们十分关心的问题,其对在现实世界中做出决策有十分重要的意义。现如今,随着计算能力的飞速提高,已有的模型模拟已经能够产生出时变的多分辨率的集合模拟数据集。因此而产生了领域科学家十分关心的两个问题:一是输入参数的敏感度信息,二是模型在不同分辨率下的精确程度。根据输入参数的敏感度信息,可以将更多的计算资源倾斜到那些对输出有更高影响上的输入变量上。同时,了解模型在不同分辨率下的精确程度,也能在节省存储和计算代价的前提下,得到足够优秀的模型输出结果。本文就针对WRF (Weather Research and Forecasting) 模型,根据其在不同参数不同分辨率下的输出,并在真实数据的辅助下,研究参数敏感度和空间分辨率精确度的关系。

继续阅读 »

在平行坐标图中集成时间序列图 (Time-Series Plots Integrated in Parallel-Coordinates Displays)

图3:探索两变量间变化的延迟的关系

时变的高维数据是一类十分复杂的数据。例如,在模型模拟数据中,通常会预先设置一些(非时变的)输入参数的数值,然后模型模拟会产生一些输出属性,其中有些是非时变的,而有些是时变的。在这些数据中,领域专家通常需要研究输入参数与输出参数、输出参数之间的关系。此时,对时变高维数据进行可视化就变得非常重要了。本篇工作中提出了一种基于平行坐标图的焦点+上下文的可视化方式,通过在平行坐标图的相邻轴之间插入时间序列图来展示时变信息。

继续阅读 »