标签存档: 信息可视化

基于像素的可视化技术的理论与应用(Designing Pixel-Oriented Visualization Techniques: Theory and Applications)

可视化大规模的高维数据在数据分析中扮演着越来越重要的角色。在众多的技术中,基于像素的可视化是一类非常有效的可视化方法。基于像素的可视化方法是在将对象的每一个数据属性映射到有限的屏幕空间内的一个像素点上,从而可视化尽可能多的可视化数据对象,并且通过排列像素点体现出数据中所存在的模式。近些年来,基于像素的可视化技术在很多具体场景中得到了广泛的应用并且充分验证了方法的有效性。本文的主要目的是讨论基于像素的可视化技术中的常见问题,对于设计该类可视化方法提供理论依据,本文所采用的方法是将基于像素的可视化技术中的设计转换为约束条件,求解约束条件进而得到设计决策,本文发现基于求解约束所得到的设计决策能够得到高效的可视化设计方法。 继续阅读 »

P5: 针对交互式数据分析和可视化的便携渐进式并行处理流水线(P5: Portable Progressive Parallel Processing Pipelines for Interactive Data Analysis and Visualization)

交互式数据分析面临的数据,体量越来越大,复杂度越来越高,导致数据转换和可视化渲染的延迟提高,这将会阻碍用户交互分析的效率。现有的应对方式包括应用并行处理等方法提高计算速度,以及通过渐进式可视化方法,使用户能快速获得对中间结果的感知。但是大部分现有的可视化工具包,不能支持应用高性能计算方法,并且提供渐进式可视化创建的能力。该工作提供了P5这一创建渐进式可视化的可视化工具包,它提供了声明式的可视化生成方式和使用GPU计算资源的功能。

继续阅读 »

FiberClay:通过雕刻三维轨迹揭示内在结构(FiberClay: Sculpting Three Dimensional Trajectories to Reveal Structural Insights )

随着在虚拟现实与增强现实的场景中,构建3D物体并与之交互的技术日渐成熟,可视化领域开始尝试利用这样的场景来探索、分析高维的数据。将空间数据在三维空间中可视化一直是备受争议的话题,在三维空间中可视化复杂的、大量的轨迹会遇到一系列挑战,例如密集轨迹的重叠问题会使得对轨迹的交互、查询变得繁复,尤其是在三维沉浸式空间中。本文提出FiberClay将轨迹在三维空间中可视化,同时结合新颖的3D刷选方法来快速选择轨迹,支持探索分析数据的内在结构。

继续阅读 »

Clustrophile 2:可视化指导聚类分析

聚类是探索性数据分析中一种流行的无监督学习方法。聚类算法通过基于相似性的度量将数据划分为子集,为分析人员提供了探索数据结构和变化的有力手段。然而,由不同算法、算法参数、数据子集和属性子集所决定的聚类空间是巨大的,如何引导用户高效地探索空间而不是漫无目的地尝试依然是一个巨大的挑战。为解决上述挑战,本文[1]提出了一种用于引导聚类分析的新型交互式工具Chustrophile 2。它指导用户进行基于聚类的探索性分析,适应用户反馈以改进用户指导,促进聚类的解释,并帮助用户快速推理聚类之间的差异。除此之外,Clustrophile 2还提供了一个新颖的功能,the Clustering Tour,根据用户的分析目标和期望选择聚类参数并推断不同聚类结果的质量。

继续阅读 »

SIRIUS:交互式对称双向降维技术(SIRIUS: Dual, Symmetric, Interactive Dimension Reductions)

在经典的降维技术中,维度(attributes)一般被视作输入而数据(observations)作为输出,用户通过与数据投影进行交互来了解数据与维度之间的关联。但在许多分析场景中,两者地位平等、相互影响、密不可分。通过分析数据之间的关系,能够揭示维度的重要性与价值,反之亦然。例如在区分西瓜与梨子时,“尺寸”是十分重要的因素。又如在强调糖分与水分的相关性时,“西瓜”便比“糖葫芦”更有说服力。为了帮助用户进行数据与维度的双向关联性分析,这篇发表于IEEE VIS 2018的文章[1]提出了SIRIUS(Symmetric Interactive Representations In a Unified System):即同一系统下的交互性对称双向降维技术。

继续阅读 »

Charticulator: 交互式构建定制的图表布局(Charticulator: Interactive Construction of Bespoke Chart Layouts)

定制的图表更具表现力,可以根据想要传递的数据洞察进行细节的设计,从而让目标用户更容易注意、理解和记忆这些图表。用户想要创建这些图表,可以使用绘图的工具,但是这些工具需要手动设置数据和属性的映射,比较低效;可以用可视化的库编写代码实现,但是用户需要有较高的编程技能;也可以使用一些交互式的可视化构建工具,但是这些一般需要用户从一些模版中进行选择,因而表现能力不足,并且提供的布局方式有限或者提供的布局构建的交互不够方便。针对已有工作存在的问题,[1]的作者们提出了Charticulator,可以灵活创建可视化布局。

继续阅读 »

在散点矩阵中使用动画来减轻重叠(Using Animation to Alleviate Overdraw in Multiclass Scatterplot Matrices)

散点矩阵(SPLOM)是可视化中渲染多变量多类别数据的常用技术。然而,多类别 SPLOMs 有透支(重叠点)的问题,大多数现有技术只关注于单个散布图与单一类的透支减轻问题。本文利用闪烁点动画来达到减轻多类别散点矩阵中的透支问题。在69个参与者的用户研究中,我们发现用户不仅在使用动画SPLAMs识别密集区域方面表现更好,而且还发现他们更容易解释,并且优于静态散点矩阵。这些结果为今后减轻多类别SPLOM透支的工作开辟了新的方向,并为应用动画减轻其他可视化形式中的透支提供了见解。

继续阅读 »

文本搜索功能对于网页端可视化的作用(The Effects of Adding Search Functionality to Interactive Visualizations on the Web)

文本搜索功能对于网页端可视化的作用

基于文本的搜索被广泛应用于各类信息检索的场景中。但受限于数据类型、交互场景等,各式网页端可视化作品却鲜少提供基于文本的搜索功能。这篇发表于CHI 2018的文章[1]通过对照实验,研究了文本搜索功能在网页端可视化中、对于用户探索与分析数据所带来的具体影响。

继续阅读 »

Data Illustrator: 使用延迟数据绑定增强矢量设计工具以实现可视化创作(Data Illustrator: Augmenting Vector Design Tools with Lazy Data Binding for Expressive Visualization Authoring)

可视化逐渐成为storytelling以及信息传播的重要的方式。在可视化的发展过程中,在电脑编程制作可视化之前,平面设计师已经可以手动制作可视化。即使在目前存在的可视化中,平面设计师制作的可视化在目前存在的可视化中也占据着很大的比重。相对于电脑制作可视化自底向上的过程,平面设计师制作可视化的过程完全不同,他们首先决定可视化在整体上的外观,然后具体将具体的数据映射到视觉元素中。本文的主要针对的问题是如何辅助平面设计师完成制作可视化,即辅助可视化设计人员用复杂的可视化映射和布局设计器创建高保真数据可视化。针对该问题,本文提出了基于延迟数据绑定的可视化制作框架,并且基于这个框架开发了辅助平面设计师设计可视化的Data Illustrator系统[1]。

继续阅读 »

事件线程:视觉总结阶段的事件序列数据分析(EventThread: Visual Summarization and Stage Analysis of Event Sequence Data)

事件序列数据,如电子健康记录、一个人的学术记录或汽车服务记录,都是一段时间内发生的一系列事件。分析事件序列的集合可以揭示常见的或语义上重要的序列模式。例如,事件序列分析可能揭示了常用的治疗疾病的护理计划,教授的典型出版模式,以及导致维护良好的汽车的服务模式。然而,在视觉上探索大量事件序列或大量事件类型的序列是具有挑战性的。现有的方法侧重于通过统计分析来提取事件的明确匹配模式,以创建随时间变化的事件进程的阶段。然而,这些方法未能捕捉到相似但不完全相同的事件序列演化的潜在簇。在本文[1] 中,我们引入了一个新的可视化系统命名事件线程集群事件序列为基于张量分析线程和可视化的潜伏阶段分类和演化模式的交互的线程分组相似到特定时间集群。通过用户与专家的访谈,在三个不同应用领域的使用场景,我们证明了事件线程的有效性。

继续阅读 »