IEEE Pacific Visualization 2016 Day 3

PacificVis 2016会议第三天的日程包括Keynote,四个Full Paper Session以及Poster Session。

本次大会的第二个Keynote由来自台湾工业技术研究院的闕志克博士带来,题目是“Visualization for Deep Learning Training”。近年来,深度学习在视频、音频、语音、文本等各类数据中都取得了巨大的成功。另一方面,如何更便利地训练深度学习模型成为了一个重要的问题。闕博士将深度学习模型与一般的软件开发进行对比,如下图所示,指出我们也需要有相应的集成开发环境来辅助开发人员来训练、改善与发展深度学习模型。

图1:对比软件开发与深度学习模型的训练

图1:对比软件开发与深度学习模型的训练

在闕博士的报告中,闕博士提出了多种利用可视化来辅助训练深度学习的例子。其中比较直接的应用是利用可视化技术展示深度神经网络中的层次结构,以及各层次中的参数和响应信息。尤其对于图像相关的深度神经网络,使用者可以借助所展示的各层次信息,来对网络进行人为的干预调节,从而依特定目的产生更加效果。例如,闕博士所举的一个例子中,可以利用深度神经网络将一副图片的风格移植到另一幅图片上,从而产生比较奇特的效果。

图2:可视化在深度学习模型训练中的应用

图2:可视化在深度学习模型训练中的应用

小结起来,深度神经网络的网络结构具有明显的树形层次结构,是可视化技术可以着力的重点方向。同时,每个层次上具有丰富的模型参数信息,相比于直接用数字形式的表现,使用可视化可以让研究人员更加便利的了解所训练的模型。

接下来的论文环节主要都是关于科学可视化的。

第一个Session为Visualization Systems and Applications,共有四篇文章,分别关注不同的应用场景来设计可视化系统。

第一篇工作“A Crowdsourcing System for Integrated and Reproducible Evaluation in Scientific Visualization” 主要关注科学可视化中的User Study问题。作者指出只有不到40%的科学可视化工作进行过User Evaluation,而没有进行User Evaluation的原因主要在于参与者招募环节和结果的分析汇报环节。为了解决这些问题,作者提出了一个基于众包的软件系统,能简化参与者的招募工作,并集成了数据分析与结果汇报的功能。研究者能直接使用这个系统来user evaluation,已有的evaluation设计也能够复用。

第二篇工作“An Integrated Visualization System for Interactive Analysis of Large, Heterogeneous Cosmology Data”针对的是宇宙学研究中的异构数据。数据来自与暗物质模拟,科学家们主要关心模拟中一种叫做“Halo”的结构的合并现象。为了研究这种现象,许多其他衍生数据也需要一起分析。这篇工作设计了一套交互分析系统,用于探索Halo结构、层次演化以及其他定量信息。同时后端也使用了并行计算与渲染框架,从而能达到实时交互的效果。

第三篇工作来自北京大学可视化小组,由舒清雅同学报告。该工作提出了一种针对时序集合模拟数据的可视化分析工具EnsembleGraph,帮助科学家了解模拟成员的相似性关系在时空中分布和演化。这个工作按照成员之间相似程度为出发点,从集合模拟数据中捕捉具有高相似度的时空地点,并用图的形式来展示:节点代表时空中具有高相似度的区域,节点之间的连边表示相邻时刻区域发生重叠。结合多视图交互的界面,用户可以直接对集合模拟数据进行快速浏览,并选择区域来比较其内集合模拟成员的分布情况。该工作把EnsembleGraph工具应用在了两组真实世界数据上:臭氧与污染排放影响实验集合模拟数据,以及一组流体力学实验集合模拟数据。该工具能帮助用户直接发现具有相近成员行为的区域,从相似性角度来分析复杂集合模拟数据,这是以往手动选取地点的方法所不可能做到的。

图3:北京大学可视化与可视分析小组的舒清雅同学正在作报告

图3:北京大学可视化与可视分析小组的舒清雅同学正在作报告

最后一篇工作“Rethinking Sensitivity Analysis of Nuclear Simulations with Topology”关注核反应模拟中的模型敏感度分析的问题。在核能工程中,通过模型来研究核反应堆的安全margin有及其重要的意义。因此了解模型对输入的敏感程度就显得尤为重要。已有的敏感度分析通常用数值来表示敏感度信息,而缺少视觉编码,从而在探索结果与交流结果的时候变得十分低效。这篇工作设计了一些可视化,从拓扑角度来展现敏感度信息。

接下来的论文报告环节是“Flow Topology Visualization”,共有3篇文章,关注于流场拓扑结构可视化方向。

首先是美国阿贡国家实验室的郭翰琦博士报告了他们对时变流场可视化研究。郭翰琦博士也是2014年从我们实验室毕业的优秀博士。FTLE(Finite-Time Lyapunov Exponent)是指有限时间李雅普诺夫指数,是衡量事变流场中稳定性特征的重要指数。这个工作对时变流场数据定义了三种新的概念:FTLE的分布(D-FTLE),分布的FTLE(FTLE-D),以及不确定性的拉格朗日结构(U-LCS)。D-FTLE是表示每一个时空点的FTLE值的概率密度函数,可以用平均、标准差、正态性检验或者统计阈值等方法来可视化。FTLE-D用过描述粒子的分散程度从而扩展了确定性FTLE值,这样可以概括粒子在临近区域内传输的行为。U-LCS描述了在空间中找到LCS结构的概率。报告展示了双螺旋、飓风、以及气象模拟数据的可视化结果,相比以往基于方差的方法,他们的方法能更清晰捕捉到飓风墙等流场细节特征,从而帮助理解流场的传输模式。

图5:美国阿贡国家实验室的郭翰琦博士正在作报告

图4:美国阿贡国家实验室郭翰琦博士正在作报告

第二篇由美国犹他大学的Wang Bei学者报告了他们在三维矢量场拓扑结构简化的研究工作。矢量场的拓扑是描述稳定矢量场结构的关键,而拓扑结构中的临界点对于描述复杂结构至关重要。通过删除临界点的结构简化技术可以帮助更好地理解诸如湍流的矢量场的特征。然而并不存在有效地技术支持直接删除三维矢量场的临界点。这个工作提出了对临界点鲁棒性的量化方法,并且在此基础上,提除层次化地组织临界点,提供基于稳定性的删除方法。这个工作并不需要提取整个三维拓扑结构,所以计算性能十分高效,此外,它还可以处理边界条件,以及度数为零的子区域中临界点删除情形,这些是其他方法不能达到的。作者把该方法运用在了人工数据和模拟数据上,并说明了有效性。

第三篇文章是“Topology-Inspired Galilean Invariant Vector Field Analysis”。向量场的topology一直是分析流场的有力工具,因为它可以将大量的流场数据转换成紧凑、稀疏的、信息损失少且易于读取的可视化结果。然而向量场的topology非常依赖于参照系,即它不满足Galilean不变性。针对这个缺陷,本文提出了一种新的满足Galilean不变性的流场topology分析方法。他们将向量场中所有点均看成是流场中的critical points(涡旋中心等),并对最不敏感的点进行局部参照系调整,即那些Jacobian行列式极值的点。然后得到一个参考系,使得尽量多的点对它都不敏感。他们还对提出的方法进行了评估,使用现有的Q-criterion法和λ2-criterion法进行对比。结果表明,他们的方法找到的topology结构与这两个现有的涡旋检测方法很相似。他们还对他们方法的有效性进行了验证。

图6:作者报告工作Topology-Inspired Galilean Invariant Vector Field Analysis

图5:作者报告工作Topology-Inspired Galilean Invariant Vector Field Analysis

第三个论文session是“Flow Field Visualization”,其中包括我们组的两位同学的工作。

第一个报告的是北京大学可视化与可视化分析实验室的张江同学,题目是“Efficient Unsteady Flow Visualization with High-Order Access Dependencies”。这个工作运用了高阶的访问转移的思想,在计算访问依赖关系时结合场线的数据访问历史信息,使得对下一步可能访问的数据块的预测不仅与当前的数据块有关,还建立在已访问的若干数据块序列上。该方法通过一个数据预处理过程,计算每一个数据块所关联的高阶访问依赖。然后,将高阶的数据访问依赖运用到并行的粒子追踪中,并使用高阶的数据预取来提高迹线的计算效率。这种高阶方法分别被应用到了全域均匀撒种的全局分析和区域撒种的局部分析中,实验证明该方法可以很大程度上提高预取数据的使用率,相比于基于一阶访问依赖的方法可以获得更高的场线计算效率。

图6:来自北京大学可视化与可视分析小组的张江同学进行论文报告

图6:来自北京大学可视化与可视分析小组的张江同学进行论文报告

第二篇工作“Comparative Visualization of Multiple Time Surfaces by Planar Surface Reformation”考虑如何平面图展开技术来比较TIme Surfaces。Time Surfaces是描述三维流场的一种方式,通过比较Time Surfaces的形态可以来比较不同积分时刻或者不同种子区域下的流场特征。但是直接进行曲面的比较无疑是一项巨大的挑战,因为曲面的形态可能会十分复杂。这个工作主要提出了一种形变技术,能将三维的Time Surfaces展开于二维平面上,并标量、矢量等信息编码于展开后的平面上,从而方便了Time Surfaces的比较。并且,作者可以在第三个维度上将多个Time Surfaces层叠起来,能够直观地观察其在时间维度上的演变过程。

第三篇工作是我们实验室刘日晨同学的工作“Comparative Visualization of Vector Field Ensembles Based on Longest Common Subsequence“。该工作提出了一种基于最长公共子序列(LCSS)的新的集合模拟向量场(vector field ensembles)度量方法。首先在每个集合向量场(不同的模拟成员)中进行迹线追踪,得到集合迹线(ensemble pathlines)。其次,对数据进行分块处理,并给每个数据块赋予全局唯一索引值。将所有集合迹线经过的数据块的索引值按时间步组成LCSS序列码,作为LCSS算法的输入。再次,使用LCSS算法度量集合迹线之间的距离,主要是计算集合迹线共同通过的块的个数,该距离作为集合迹线之间的不确定性。最后,将所有集合迹线的不确定性可视化出来并进行分析。

图8:来自北京大学可视化与可视分析小组的刘日晨同学进行论文报告

图7:来自北京大学可视化与可视分析小组的刘日晨同学进行论文报告

最后一个session是“Molecular Visualization”,主要为生物分子相关的可视化工作。

第一篇文章是印度理学院的工作,题目是“An Integrated Geometric and Topological Approach to Connecting Cavities in Biomolecules”。他们工作的背景是,在分子生物学研究中,对细胞的空腔与管道的研究可以帮助人们更加深入了解分子在各种功能中的机理。目前提取这些结构特征的技术对粒子位置和粒子半径的不确定性都非常敏感。针对这些不确定性,该工作提出了一种将用户指定的空腔连接起来的优化方法。他们利用空腔在细胞组织中拓扑结构来计算和优化管道的位置。此外,该工作还提供了一系列的交互,使得用户可以很方便地提取细胞组织中的空腔与管道结构。

第二篇工作是“Accelerated Visualization of Transparent Molecular Surfaces in Molecular Dynamics”,其主要针对生物分子的结构特征及其动态行为,目的是给生物化学家提供一种实时分子动态运动的直观展示和精确特征提取。该工作将分子表面和内腔同时进行考虑,提出了一种实时可视化和分析蛋白质分子动力学的方法,使得用户可以交互式地对其结构进行操作,从而有效地探索蛋白质及其内腔和行为。作者还引入了一系列的感知增强方法,例如通过调节用户定义的参数进行透明的分子表面渲染和内腔渲染等,来达到此效果。作者实现了对这些算法的实时计算,给用户的探索提供了极大的便利性。

第三篇工作“Interactive Exploration of Atomic Trajectories Through Relative-Angle Distribution and Associated Uncertainties”主要是为了解决一种对原子轨迹探索的统计度量方法—相对角度分布(relative-angle distribution)—的缺点。作者提出了一种新的探索原子轨迹的分析工具,将数据和绘制错误带来的不确定性与交互式直方图可视化进行结合,对相对角度分布在合适的分辨率和粒度进行二维可视化,再对统计分析辅以三维轨迹可视化。该工具可以对原子轨迹进行全面的探索,弥补了已有方法的缺陷。

图9 poster展示环节

图8: poster展示环节

Full paper session结束后是poster session,大家来到了会议展厅对poster进行了展示和交流。本次大会共接收了15篇高质量poster,其中包括北京大学可视化小组的4篇。poster的展示时间一共一个小时,每个作者都会在其poster前向其他人介绍自己的工作和想法,并就里面的问题与参观者交流并解答,因此这个环节也是与会者们进行思想碰撞,挖掘共同学术兴趣的盛会。

评论关闭。