作者存档: Fan Hong

可视化助力理解地震活动

近些年来,世界范围内频繁的地震活动对人类社会造成了巨大的影响。十年前,2008年的5月12日,发生在四川省汶川的8级地震就造成了数十万人死伤,破坏面积超过数十万平方公里。在地震领域,科学家们已经开展了长期的针对地震发生过程的研究,并期望通过研究来减少强震带来的伤亡。其中,一些观测和研究表明地震活动可能与电离层中的异常信号相关,并据此提出了一个假说:在地震发生前,震中以及附近的岩石圈活动会释放电磁辐射到空气中,从而导致电离层相关信号的扰动。DEMETER卫星是由法国发射的、第一颗用于研究电离层扰动与地震活动相关性的卫星。北京大学可视化与可视分析实验室和中国地震台网中心的张永仙研究员合作,提出了一个可视分析系统,用于帮助科学家研究分析DEMETER卫星采集的电离层数据和地震事件之间的相关性。这个工作也于去年被SIGGRAPH Asia Symposium on Visualization接收,获得最佳论文提名奖。应组织者的邀请,今年5月12日至14日成都举办的“汶川地震十周年国际研讨会 暨第四届大陆地震国际研讨会”上,由实验室袁晓如研究员作了进一步交流。

继续阅读 »

文本分析中的深度神经网络可视化 (Visualizing Deep Neural Networks for Text Analytics)

图3:图2在输入数据激活后的可视化效果图

如今,深度神经网络(DNN)在许多领域都取得了瞩目的成绩。但是,对于深度神经网络内部行为的了解还有待深入研究。一方面,对于其工作原理的直观理解还十分缺乏;另一方面,对于深度神经网络学习到了什么样的特征也还不清楚。已有可视化工作对于这个问题已经进行了一些研究,但主要集中于图像相关应用中的卷积神经网络(CNN)和文本分析中的循环神经网络(RNN),而对于卷积神经网络和全连接神经网络(FCN)在文本分析中的可视化还没有研究。本文将研究这个问题。

继续阅读 »

使用长短期记忆模型学习并行粒子追踪里的数据访问模式 (Access Pattern Learning with Long Short-Term Memory for Parallel Particle Tracing)

粒子追踪是流场可视化与分析里最重要的技术之一,被大量应用在场线渲染、源汇查询、有限时间李雅普诺夫指数计算等应用中。然而,在大规模流场中,对大量粒子通过粒子追踪算法计算轨迹时,由于粒子访问数据块的局部性很差,导致计算过程中有大量时间消耗在数据块的读入上。一种提高数据块访问效率的做法,就是对粒子将要访问的数据块进行预测,然后提前进行预读取,从而将读入花费隐藏在计算时间之下。这个工作首次引入了深度学习模型,即基于长短期记忆 (Long Short-Term Memory, LSTM) 的模型,对粒子轨迹进行建模,从而能更为准确地预测粒子对数据块的访问,从而提高大规模粒子追踪算法的效率。

继续阅读 »

一种基于三维卷积稀疏编码的体渲染智能系统方案 (An Intelligent System Approach for Probabilistic Volume Rendering using Hierarchical 3D Convolutional Sparse Coding)

图8:Kiwi数据和Aneurysm数据的体渲染结果,分别为[2]、[3]和本文方法

直接体渲染是一种表现三维体数据的强大可视化手段。过去数十年间,研究者们进行了大量的研究,来提高体渲染的速度与质量。其中,传递函数的设计是影响这两个指标的一个重要因素。传递函数将体素的值映射到诸如颜色、不透明度、可见性等光学性质。然而,要设计一个好的传递函数通常面临着很大的困难,对非专业使用者更是如此。绝大多数传递函数设计的方法都依赖用户大量的交互,用户需要根据数据的统计特征,通过不断试错,以求达到好的效果。这里的统计特征通常是数据某些属性的直方图。在本文中,作者提出了一种基于机器学习方法:三维卷积稀疏编码,能对体素进行精确分类,从而得到优秀的体渲染结果。同时,基于智能系统的交互方式,能让用户通过直观的输入,来完成传递函数设计过程。

继续阅读 »

分析深度生成模型的训练过程 (Analyzing the Training Processes of Deep Generative Models)

DGMTracker系统界面

深度生成模型是针对非监督学习和半监督学习的一种强有力的解决方案。通过深度生成模型,深度学习在没有外部数据标签或者带标签数据集过小的情况下仍然能继续工作。与其他的深度模型,比如卷积神经网络,更强有力的深度生成模型,也意味着其训练过程对训练者的要求更高。一方面,生成模型既有着确定性的函数,又包含随机变量;另一方面,生成模型是一种自上而下不断生成细节的过程,而诸如卷积神经网络则是从细节中不断提取高层特征的自底向上的过程。综合这两方面,如果理解深度生成模型的训练过程,以及如何对其过程进行诊断就变得尤其重要。本文就考虑用可视分析的手段来帮着这个分析过程。

继续阅读 »

LSTMVis:一个递归神经网络中隐含状态动态变化的可视分析工具 (LSTMVis: A Tool for Visual Analysis of Hidden State Dynamics in Recurrent Neural Networks)

图3:LSTMVis的用户界面

深度神经网络已经在计算视觉、自然语言处理等许多领域中取得了卓越的性能表现。深度神经网络能够自动地学习输入数据的隐含特征表示,用于相关任务。之所以称之为“隐含”特征表示,是因为这些特征表示难以以原始输入数据的形式表示出来,从而让使用者难以理解深度神经网络到底学习到了数据的什么信息。现有的研究中,有许多深度神经网络被广泛应用:标准的前馈神经网络、用于图片任务的卷积神经网络、以及用于对序列数据建模的递归神经网络等等。本文主要关注一类递归神经网络——长短期记忆(Long Short-Term Memory, LSTM)模型中隐含状态表示的可视化。

继续阅读 »

对人工神经网络的隐式行为进行可视化 (Visualizing the Hidden Activity of Artificial Neural Networks)

图3:训练前后MLP最后一层数据表示的投影图

在许多机器学习任务中,人工神经网络尤其是近些年发展起来的深度学习网络,已经取得了十分瞩目的结果。然而,以前研究者往往将神经网络的内部行为当作黑盒来看待,神经网络到底学习到了什么并不了解。近些年来,研究者们逐渐开始关注这一问题,并通过了解其内部行为来帮助优化模型。而这篇工作则是从可视化的角度出发来对待这个问题。

继续阅读 »

时变集合模拟数据中的趋势特征可视分析 (Visual Trends Analysis in Time-Varying Ensembles)

图3:趋势图的构建

集合模拟数据是现今科学可视化领域中的重要挑战之一。对于同一个物理现象,使用多个物理模型或者同一模型多组不同参数进行模拟,产生的一组模拟结果就称之为集合模拟数据,每个单独的结果称之为集合成员。对集合模拟数据的研究,一方面可以对各个结果之间的相似性和相异性进行分析,另一方面可以用于进行模型参数的优化。而这个工作主要关注的对应两个问题就是:时变集合模拟数据中趋势特征和异常成员的识别,以及和参数空间的结合探索。

继续阅读 »

区间似然树:一种可视探索不确定性数据集的紧凑高效的表示方法 (Range Likelihood Tree: A Compact and Effective Representation for Visual Exploration of Uncertain Data Sets)

本文针对的数据是具有不确定性的标量场数据。我们知道,普通的标量场数据在一个空间格点上只会确定的取一个数值。而在具有不确定性的标量场数据中,一个空间格点会以一定概率分布取不同的标量值。因此,这种数据也被称为概率分布场数据。这类数据在原有的空间维度上新增加了一个分布维度,因此对这类数据的可视化和分析会十分困难。已有的方法或者基于一些统计指标对概率分布进行约减,或者通过定义概率分布间的相似性来进行分析。而本文则提出使用累积概率来进行分析。

继续阅读 »

IEEE Pacific Visualization Symposium 2017 – Day 1

Bongshin Lee对PacificVis近十年的情况进行了可视化与总结

今天是IEEE PacificVis会议正式日程的第一天。首先进行的是大会的开幕式。大会主席Bongshin Lee和Jinwook Seo欢迎各位与会者,并介绍了这次会议的参与情况。今年共有来自19个国家的133人参与,其中来自大陆的可视化研究者有22名。接着,论文、短论文、海报张贴与storytelling竞赛的主席分别对各自部分的参与、评审以及接收情况进行了介绍。本次会议共接受论文29篇,分数均在3.5及以上。我们实验室陆旻同学的论文《Interaction+: Interaction Enhancement for Web-based Visualizations》被全文接收。图可视化主题在今年所接受论文、海报张贴中都有着很大的比例。

继续阅读 »