月度存档: 四月 2018

喷气机引擎模拟数据之原位预测驱动特征分析(In Situ Prediction Driven Feature Analysis In Jet Engine Simulations)

在喷气机发动机转子中,局部气流不稳可能会对发动机产生不可逆的损坏,这种局部气流不稳称为滞障(Stall)。发动机运行过程中,相关领域的专家希望观察气流滞障的产生过程以及实时观测探究不同参数设置对滞障产生过程的影响。本工作主要探究的参数设置为矫正块流率(CMFcorrected mass flow rate)。

滞障没有明确定义及解析表达,判断某区域是否处于滞障状态只能依靠专家的经验知识。而依靠人力进行判断在大规模数据多时间步实时探究的要求下不可行。因此本工作提出了预测驱动的特征分析。在此预测驱动是指通过机器学习方法,学习专家对滞障状态的解析表达的判断。

继续阅读 »

文本分析中的深度神经网络可视化 (Visualizing Deep Neural Networks for Text Analytics)

图3:图2在输入数据激活后的可视化效果图

如今,深度神经网络(DNN)在许多领域都取得了瞩目的成绩。但是,对于深度神经网络内部行为的了解还有待深入研究。一方面,对于其工作原理的直观理解还十分缺乏;另一方面,对于深度神经网络学习到了什么样的特征也还不清楚。已有可视化工作对于这个问题已经进行了一些研究,但主要集中于图像相关应用中的卷积神经网络(CNN)和文本分析中的循环神经网络(RNN),而对于卷积神经网络和全连接神经网络(FCN)在文本分析中的可视化还没有研究。本文将研究这个问题。

继续阅读 »

对于赋予表现力的故事讲述的设计空间和思考(Timelines Revisited: A Design Space and Considerations for Expressive Storytelling)

时间线早在几个世纪前就被用来表达序列事件。为了用时间线讲述更富有表现力的故事,并保持对于知觉性和故事有效性的关心。Timelines Revisited[1]这个工作将设计空间总结为3个维度:表达、比例、布局。这项工作的两个主要贡献分别是:①介绍和分析用时间线讲述故事的设计空间。②用设计空间在一个沙盒环境中实现一个可行的时间线设计。

继续阅读 »

并行粒子追踪中基于数据重划分的动态负载平衡方法 (Dynamic Data Repartitioning for Load-Balanced Parallel Particle Tracing)

在流场可视化中,粒子追踪是一种非常基础的技术。通过在流场区域追踪大规模的粒子,研究者可以进行各种各样的流场应用,例如生成流线和迹线去分析复杂流场内部结构等。但是,在应用粒子追踪时,我们往往需要处理大规模数据,其计算代价也非常高,因而需要更具可扩展性的并行算法。目前,最常见的并行粒子追踪算法是数据并行,如图1所示,即在初始时将数据划分为数据块并将这些块分配给不同的进程,之后的粒子追踪过程中,粒子在每个数据块中进行追踪计算并在数据块间进行交换,直至所有粒子追踪完成(即达到最大追踪步数,或者提前穿出了流场边界)。但是,这些数据块的负载很可能会非常不均衡。例如,某些数据块中可能存在漩涡等流场特征,导致附近的粒子会“陷入”其中。尽管存在一些静态负载平衡方法,试图在初始化阶段就将数据块进行负载均衡的划分和分配,但它们都需要进行比较复杂的预处理。因此,我们提出了一种基于数据重划分的动态负载平衡方法,使用一般的初始数据划分和分配策略,在运行时周期性地对数据块负载进行评估并据此进行重划分,从而重新平衡每个进程的负载。相关工作[1]已被IEEE PacificVis 2018接收,并在近日由实验室张江同学在IEEE PacificVis 2018会议上进行了报告。

继续阅读 »

使用长短期记忆模型学习并行粒子追踪里的数据访问模式 (Access Pattern Learning with Long Short-Term Memory for Parallel Particle Tracing)

粒子追踪是流场可视化与分析里最重要的技术之一,被大量应用在场线渲染、源汇查询、有限时间李雅普诺夫指数计算等应用中。然而,在大规模流场中,对大量粒子通过粒子追踪算法计算轨迹时,由于粒子访问数据块的局部性很差,导致计算过程中有大量时间消耗在数据块的读入上。一种提高数据块访问效率的做法,就是对粒子将要访问的数据块进行预测,然后提前进行预读取,从而将读入花费隐藏在计算时间之下。这个工作首次引入了深度学习模型,即基于长短期记忆 (Long Short-Term Memory, LSTM) 的模型,对粒子轨迹进行建模,从而能更为准确地预测粒子对数据块的访问,从而提高大规模粒子追踪算法的效率。

继续阅读 »

Data Illustrator: 使用延迟数据绑定增强矢量设计工具以实现可视化创作(Data Illustrator: Augmenting Vector Design Tools with Lazy Data Binding for Expressive Visualization Authoring)

可视化逐渐成为storytelling以及信息传播的重要的方式。在可视化的发展过程中,在电脑编程制作可视化之前,平面设计师已经可以手动制作可视化。即使在目前存在的可视化中,平面设计师制作的可视化在目前存在的可视化中也占据着很大的比重。相对于电脑制作可视化自底向上的过程,平面设计师制作可视化的过程完全不同,他们首先决定可视化在整体上的外观,然后具体将具体的数据映射到视觉元素中。本文的主要针对的问题是如何辅助平面设计师完成制作可视化,即辅助可视化设计人员用复杂的可视化映射和布局设计器创建高保真数据可视化。针对该问题,本文提出了基于延迟数据绑定的可视化制作框架,并且基于这个框架开发了辅助平面设计师设计可视化的Data Illustrator系统[1]。

继续阅读 »

基于图像和分布的大规模数据体绘制 (Image and Distribution Based Volume Rendering for Large Data Sets)

随着高性能计算技术的发展,领域科学家可以使用超级计算机对一些物理现象进行建模,并进行高分辨率的模拟。通过对模拟输出结果进行可视化和分析,科学家可以对这些物理现象有更深入的理解。但是,由于数据规模的不断增大,网络和存储设备的有限带宽和容量成为了一个重要的瓶颈。针对这一问题,研究者提出了原位数据可视化和分析的方法。这种方法使用相同的超级计算机资源,可以在不用移动原始数据的情况下生成紧凑型的数据代理(proxy)。之后,用户只需要对这些数据代理在后处理机器上进行分析。这里面,一类有效的方法是基于图像的方法。通过预先选择几个有意义的视角,其可以从原始数据中生成图像用于后处理分析。然而,这些方法在使用传递函数发现和分析被遮挡特征真一方面的能力非常有限,并且产生的基于图像的代理也会造成不可避免的信息损失,加大了对数据进一步分析的复杂度。为了解决这个问题,今年PacificVis会议上的一篇文章[1]提出了一种基于图像和分布的大规模数据表示方法,将原始数据存储为基于图像的数据代理,可以在资源有限的后处理机器上进行传递函数探索,并对其中引入的误差进行量化和可视化。

继续阅读 »

One Reality: 通过结合多种混合现实方式增强物理世界体验(One Reality: Augmenting How the Physical World is Experienced by combining Multiple Mixed Reality Modalities )

为了结合数字世界和真实物理世界交互和展示优点,人们已经开发了多种混合现实技术,诸如空间增强现实技术(SAR)[1]等等。为了解决现有多种MR设备相互结合的困难,以提高用户沉浸式探索体验,降低注意力转移的代价,本文[2]提出并实现了一个结合多种混合现实方法的概念框架,将现实空间到虚拟空间之间依据增强等级划分为6个阶段,同时使用两个案例解释整个框架的工作流程。

继续阅读 »

将基本的D3图标转化为可重用的风格模板(Converting Basic D3 Charts into Reusable Style Templates)

这篇工作介绍一种将基本D3图表转换为可重用样式模板的技术。给定一个新的数据源,这篇工作应用样式模板来生成一个描述新数据的图表。为了构造样式模板,这篇工作首先解构D3图表中的:数据,标记和数据的映射。然后,这篇工作对解构出的映射的做感知有效性进行排序。要将生成的样式模板应用于新的数据源这篇工作们首先要获取每个新数据字段的重要性等级。然后,这篇工作调整模板映射以通过将最重要的数据字段与最感知有效的映射进行匹配来描述源数据。这篇工作展示了样式模板如何以数据表格或其他D3图表的形式应用于源数据。虽然这篇工作的实现侧重于为基本图表类型(例如条形图,折线图,点图,散点图等)生成模板,但这些是当前最常用的图表类型。用户可以很容易地在Web上找到这些基本的D3图表,将它们变成模板,并立即看到他们自己的数据在模板的视觉样式(例如颜色,形状,字体等)中的外观。这篇工作通过将多样化的样式模板应用到各种源数据集来证明这篇工作方法的有效性[3]。

继续阅读 »

事件线程:视觉总结阶段的事件序列数据分析(EventThread: Visual Summarization and Stage Analysis of Event Sequence Data)

事件序列数据,如电子健康记录、一个人的学术记录或汽车服务记录,都是一段时间内发生的一系列事件。分析事件序列的集合可以揭示常见的或语义上重要的序列模式。例如,事件序列分析可能揭示了常用的治疗疾病的护理计划,教授的典型出版模式,以及导致维护良好的汽车的服务模式。然而,在视觉上探索大量事件序列或大量事件类型的序列是具有挑战性的。现有的方法侧重于通过统计分析来提取事件的明确匹配模式,以创建随时间变化的事件进程的阶段。然而,这些方法未能捕捉到相似但不完全相同的事件序列演化的潜在簇。在本文[1] 中,我们引入了一个新的可视化系统命名事件线程集群事件序列为基于张量分析线程和可视化的潜伏阶段分类和演化模式的交互的线程分组相似到特定时间集群。通过用户与专家的访谈,在三个不同应用领域的使用场景,我们证明了事件线程的有效性。

继续阅读 »