分类存档: 论文报告

Timelines Revisited: 对于赋予表现力的故事讲述的设计空间和思考(Timelines Revisited: A Design Space and Considerations for Expressive Storytelling)

时间线早在几个世纪前就被用来表达序列事件。为了用时间线讲述更富有表现力的故事,并保持对于知觉性和故事有效性的关心。Timelines Revisited[1]这个工作将设计空间总结为3个维度:表达、比例、布局。这项工作的两个主要贡献分别是:①介绍和分析用时间线讲述故事的设计空间。②用设计空间在一个沙盒环境中实现一个可行的时间线设计。

继续阅读 »

基于图像和分布的大规模数据体绘制 (Image and Distribution Based Volume Rendering for Large Data Sets)

随着高性能计算技术的发展,领域科学家可以使用超级计算机对一些物理现象进行建模,并进行高分辨率的模拟。通过对模拟输出结果进行可视化和分析,科学家可以对这些物理现象有更深入的理解。但是,由于数据规模的不断增大,网络和存储设备的有限带宽和容量成为了一个重要的瓶颈。针对这一问题,研究者提出了原位数据可视化和分析的方法。这种方法使用相同的超级计算机资源,可以在不用移动原始数据的情况下生成紧凑型的数据代理(proxy)。之后,用户只需要对这些数据代理在后处理机器上进行分析。这里面,一类有效的方法是基于图像的方法。通过预先选择几个有意义的视角,其可以从原始数据中生成图像用于后处理分析。然而,这些方法在使用传递函数发现和分析被遮挡特征真一方面的能力非常有限,并且产生的基于图像的代理也会造成不可避免的信息损失,加大了对数据进一步分析的复杂度。为了解决这个问题,今年PacificVis会议上的一篇文章[1]提出了一种基于图像和分布的大规模数据表示方法,将原始数据存储为基于图像的数据代理,可以在资源有限的后处理机器上进行传递函数探索,并对其中引入的误差进行量化和可视化。

继续阅读 »

将基本的D3图标转化为可重用的风格模板(Converting Basic D3 Charts into Reusable Style Templates)

这篇工作介绍一种将基本D3图表转换为可重用样式模板的技术。给定一个新的数据源,这篇工作应用样式模板来生成一个描述新数据的图表。为了构造样式模板,这篇工作首先解构D3图表中的:数据,标记和数据的映射。然后,这篇工作对解构出的映射的做感知有效性进行排序。要将生成的样式模板应用于新的数据源这篇工作们首先要获取每个新数据字段的重要性等级。然后,这篇工作调整模板映射以通过将最重要的数据字段与最感知有效的映射进行匹配来描述源数据。这篇工作展示了样式模板如何以数据表格或其他D3图表的形式应用于源数据。虽然这篇工作的实现侧重于为基本图表类型(例如条形图,折线图,点图,散点图等)生成模板,但这些是当前最常用的图表类型。用户可以很容易地在Web上找到这些基本的D3图表,将它们变成模板,并立即看到他们自己的数据在模板的视觉样式(例如颜色,形状,字体等)中的外观。这篇工作通过将多样化的样式模板应用到各种源数据集来证明这篇工作方法的有效性[3]。

继续阅读 »

事件线程:视觉总结阶段的事件序列数据分析(EventThread: Visual Summarization and Stage Analysis of Event Sequence Data)

事件序列数据,如电子健康记录、一个人的学术记录或汽车服务记录,都是一段时间内发生的一系列事件。分析事件序列的集合可以揭示常见的或语义上重要的序列模式。例如,事件序列分析可能揭示了常用的治疗疾病的护理计划,教授的典型出版模式,以及导致维护良好的汽车的服务模式。然而,在视觉上探索大量事件序列或大量事件类型的序列是具有挑战性的。现有的方法侧重于通过统计分析来提取事件的明确匹配模式,以创建随时间变化的事件进程的阶段。然而,这些方法未能捕捉到相似但不完全相同的事件序列演化的潜在簇。在本文[1] 中,我们引入了一个新的可视化系统命名事件线程集群事件序列为基于张量分析线程和可视化的潜伏阶段分类和演化模式的交互的线程分组相似到特定时间集群。通过用户与专家的访谈,在三个不同应用领域的使用场景,我们证明了事件线程的有效性。

继续阅读 »

Map-based Graph Visualization

地图形式的图可视化方式指将图中的社群用一段连续的区域表示,不同的社群构成了地图上不同的“国家”。这样的可视化方式既可以提高可视化美观度,吸引用户花更多的时间探索数据[1];又可以增强用户的对可视化内容的记忆,更准确回忆自己的发现结果[2]。

继续阅读 »

Podium:用混合驱动的可视分析对数据排序(Podium: Ranking Data Using Mixed-Initiative Visual Analytics)

对数据进行排序是数据分析中基础的操作之一。人们使用排序来理解大数据集中最重要的元素、根据数据属性进行决策、或者给原本没有排名的数据增加排名以表达某种含义。例如,人们会按照统计数据给球队排名,会根据电影的特性或者票房给电影排序等等。人们也会将一些排名和自己的认识进行对比,例如球队的粉丝可能希望理解专家发布的排名是基于什么样的准则。

继续阅读 »

EVA: 可视分析用于识别欺诈事件

金融机构需要为他们的客户确保安全和质量,如银行需要及时识别和阻止有害的交易。 为了检测欺诈操作,通常使用数据挖掘技术和客户画像分析,但是这些方法目前还没有得到可视分析的支持。 然而可视分析技术可以帮助增强知识发现的过程,并提高欺诈事件探测系统检测和预测的准确性。因此,这篇文章提出了EVA,一种用于欺诈交易的可视化分析方法,将自动算法与可视分析相结合,提高系统检测的准确性。

继续阅读 »

对TensorFlow中数据流图的可视分析(Visualizing Dataflow Graphs of Deep Learning Models in TensorFlow)

对TensorFlow中数据流图的可视分析

TensorFlow是谷歌开发的、当下最流行的机器学习软件库之一。它采用数据流图(Dataflow Graph)来表达机器学习算法的计算过程,用户可以定制不同的数据流图来构建自己的算法。然而,随着深度学习的兴起与流行,各类神经网络渐趋大规模、复杂化。算法开发者仅凭借自身的理解与记忆、很难把握算法的各部分体系结构,相互之间也难以进行沟通。为此,这篇文章[1]提出了可视化工具TensorFlow Graph Visualizer,通过可视分析帮助用户在TensorFlow中进行算法分析与开发。值得一提的是,该文章荣获了IEEE VAST 2017的最佳论文奖(Best Paper Award)。

继续阅读 »

在可视分析中系统地结合降维投影与聚类方法(Towards a Systematic Combination of Dimension Reduction and Clustering in Visual Analytics)

在可视分析中系统地结合降维投影与聚类方法

在高维数据分析中,聚类(Clustering)与降维(Dimension Reduction)都是常用的机器学习方法。前者尝试对数据进行归纳分类,而后者则试图压缩维度并尽可能地保留分布信息。可视分析往往结合两者的优点,以帮助用户更好地挖掘数据隐含的信息。在具体应用中,我们应该如何挑选聚类和降维方法呢?两者的结合都有哪些因素需要考虑,又有哪几种不同的方案呢?这篇发表于IEEE VAST 2017的文章[1] 便系统地探讨了这些问题。

继续阅读 »

我手中的全息图:可感知的沉浸式增强现实中的三维可视化交互探索效率如何?(The Hologram in My Hand: How Effective is Interactive Exploration of 3D Visualizations in Immersive Tangible Augmented Reality?)

随着新型展示和交互技术的发展,信息可视化已经不再局限于传统的桌面应用。AR,VR领域日新月异,越来越多的可穿戴设备能够支持多自由度交互和沉浸式展示,为人们身临其境地和数据交互,深入理解数据对象提供了很大便利。对于一些三维视图,传统的桌面可视化在展示性能上仍有不足。我们很自然地想到结合这两种技术,让用户使用头戴式设备在沉浸式环境下进行三维数据探索,但这同时也引起我们产生一个疑问——用户和真实世界中全息图进行交互探索,和传统可视化相比是否是一种更有效率的策略?这篇文章[1]给出了一个有关桌面三维可视化、平板电脑中的AR可视化、和头戴式设备中的沉浸式可视化在完成三维探索任务性能上的研究,通过分别完成三维点云中的几个基本问题,从而比较三种方式完成任务效率等方面的差异。

继续阅读 »