作者存档: Fan Hong

LSTMVis:一个递归神经网络中隐含状态动态变化的可视分析工具 (LSTMVis: A Tool for Visual Analysis of Hidden State Dynamics in Recurrent Neural Networks)

图3:LSTMVis的用户界面

深度神经网络已经在计算视觉、自然语言处理等许多领域中取得了卓越的性能表现。深度神经网络能够自动地学习输入数据的隐含特征表示,用于相关任务。之所以称之为“隐含”特征表示,是因为这些特征表示难以以原始输入数据的形式表示出来,从而让使用者难以理解深度神经网络到底学习到了数据的什么信息。现有的研究中,有许多深度神经网络被广泛应用:标准的前馈神经网络、用于图片任务的卷积神经网络、以及用于对序列数据建模的递归神经网络等等。本文主要关注一类递归神经网络——长短期记忆(Long Short-Term Memory, LSTM)模型中隐含状态表示的可视化。

继续阅读 »

对人工神经网络的隐式行为进行可视化 (Visualizing the Hidden Activity of Artificial Neural Networks)

图3:训练前后MLP最后一层数据表示的投影图

在许多机器学习任务中,人工神经网络尤其是近些年发展起来的深度学习网络,已经取得了十分瞩目的结果。然而,以前研究者往往将神经网络的内部行为当作黑盒来看待,神经网络到底学习到了什么并不了解。近些年来,研究者们逐渐开始关注这一问题,并通过了解其内部行为来帮助优化模型。而这篇工作则是从可视化的角度出发来对待这个问题。

继续阅读 »

时变集合模拟数据中的趋势特征可视分析 (Visual Trends Analysis in Time-Varying Ensembles)

图3:趋势图的构建

集合模拟数据是现今科学可视化领域中的重要挑战之一。对于同一个物理现象,使用多个物理模型或者同一模型多组不同参数进行模拟,产生的一组模拟结果就称之为集合模拟数据,每个单独的结果称之为集合成员。对集合模拟数据的研究,一方面可以对各个结果之间的相似性和相异性进行分析,另一方面可以用于进行模型参数的优化。而这个工作主要关注的对应两个问题就是:时变集合模拟数据中趋势特征和异常成员的识别,以及和参数空间的结合探索。

继续阅读 »

区间似然树:一种可视探索不确定性数据集的紧凑高效的表示方法 (Range Likelihood Tree: A Compact and Effective Representation for Visual Exploration of Uncertain Data Sets)

本文针对的数据是具有不确定性的标量场数据。我们知道,普通的标量场数据在一个空间格点上只会确定的取一个数值。而在具有不确定性的标量场数据中,一个空间格点会以一定概率分布取不同的标量值。因此,这种数据也被称为概率分布场数据。这类数据在原有的空间维度上新增加了一个分布维度,因此对这类数据的可视化和分析会十分困难。已有的方法或者基于一些统计指标对概率分布进行约减,或者通过定义概率分布间的相似性来进行分析。而本文则提出使用累积概率来进行分析。

继续阅读 »

IEEE Pacific Visualization Symposium 2017 – Day 1

Bongshin Lee对PacificVis近十年的情况进行了可视化与总结

今天是IEEE PacificVis会议正式日程的第一天。首先进行的是大会的开幕式。大会主席Bongshin Lee和Jinwook Seo欢迎各位与会者,并介绍了这次会议的参与情况。今年共有来自19个国家的133人参与,其中来自大陆的可视化研究者有22名。接着,论文、短论文、海报张贴与storytelling竞赛的主席分别对各自部分的参与、评审以及接收情况进行了介绍。本次会议共接受论文29篇,分数均在3.5及以上。我们实验室陆旻同学的论文《Interaction+: Interaction Enhancement for Web-based Visualizations》被全文接收。图可视化主题在今年所接受论文、海报张贴中都有着很大的比例。

继续阅读 »

分布导向的喷气发动机模拟的原位分析和可视化 (In Situ Distribution Guided Analysis and Visualization of Transonic Jet Engine Simulations)

图9:低压强和高熵值不确定等值面可视化

这篇文章关注的是一个科学应用领域的问题:喷气发动机的旋转失速 (rotating stall) 现象。喷气发动机中的压气机在运转过程中,可能由于气流的不稳定,阻碍压气机中叶片的旋转,从而导致叶片逐渐停止转动,发动机失去动力。这是一种十分危险的现象。领域科学家们希望借由模拟来研究旋转失速这种现象,尤其是希望能发现这种现象的早期征兆,从而预防其发生。最近,NASA开发了名叫TURBO的模型,能够以非常高的精度来模拟压气机的行为,从而能够极大地帮助领域专家对旋转失速的研究。然而,其模型的高精度特性也使得产生的数据量非常巨大,存储所有数据带来的I/O花费变得难以承受,从而导致传统的后处理 (post-processing) 分析难以直接应用。基于这些背景,本文提出了分布 (distribution) 数据导向的原位分析和可视化框架,用以解决这个问题。这篇文章来自于今年的IEEE VIS科学可视化部分,并获得了最佳论文的提名奖。

继续阅读 »

多空间分辨率的时变气候集合模拟数据可视化 (Visualization of Time-Varying Weather Ensembles Across Multiple Resolutions)

系统的可视化界面

在气象相关的集合模拟中,量化模型中的不确定性是领域科学家们十分关心的问题,其对在现实世界中做出决策有十分重要的意义。现如今,随着计算能力的飞速提高,已有的模型模拟已经能够产生出时变的多分辨率的集合模拟数据集。因此而产生了领域科学家十分关心的两个问题:一是输入参数的敏感度信息,二是模型在不同分辨率下的精确程度。根据输入参数的敏感度信息,可以将更多的计算资源倾斜到那些对输出有更高影响上的输入变量上。同时,了解模型在不同分辨率下的精确程度,也能在节省存储和计算代价的前提下,得到足够优秀的模型输出结果。本文就针对WRF (Weather Research and Forecasting) 模型,根据其在不同参数不同分辨率下的输出,并在真实数据的辅助下,研究参数敏感度和空间分辨率精确度的关系。

继续阅读 »

在平行坐标图中集成时间序列图 (Time-Series Plots Integrated in Parallel-Coordinates Displays)

图3:探索两变量间变化的延迟的关系

时变的高维数据是一类十分复杂的数据。例如,在模型模拟数据中,通常会预先设置一些(非时变的)输入参数的数值,然后模型模拟会产生一些输出属性,其中有些是非时变的,而有些是时变的。在这些数据中,领域专家通常需要研究输入参数与输出参数、输出参数之间的关系。此时,对时变高维数据进行可视化就变得非常重要了。本篇工作中提出了一种基于平行坐标图的焦点+上下文的可视化方式,通过在平行坐标图的相邻轴之间插入时间序列图来展示时变信息。

继续阅读 »

IEEE Pacific Visualization 2016 Day 3

PacificVis 2016会议第三天的日程包括Keynote,四个Full Paper Session以及Poster Session。

本次大会的第二个Keynote由来自台湾工业技术研究院的闕志克博士带来,题目是“Visualization for Deep Learning Training”。近年来,深度学习在视频、音频、语音、文本等各类数据中都取得了巨大的成功。另一方面,如何更便利地训练深度学习模型成为了一个重要的问题。闕博士将深度学习模型与一般的软件开发进行对比,如下图所示,指出我们也需要有相应的集成开发环境来辅助开发人员来训练、改善与发展深度学习模型。 继续阅读 »

科学大数据可视化学术研讨会成功举办

科学大数据可视化学术研讨会于2015年12月19日在北京大学举办。来自国防科技大学、北京应用物理与计算数学研究所、天津大学、中科院网络中心、北京林业大学以及北京大学可视化与可视分析研究组的三十余人参加了这次学术研讨会。

李思昆教授介绍高性能与原位可视化

李思昆教授介绍高性能与原位可视化

继续阅读 »