分类存档: 论文报告

非整洁数据:表格未知原因的有效性 (Untidy Data: The Unreasonable Effectiveness of Tables)

数据表格是一种人们熟悉的、原始的数据表现方式。在商业产品与数据统计分析工具繁多的当下,数据表格仍然在意义构建中扮演着重要的角色,并且绝大多数的数据工作者会选择使用数据表格作为他们的主要工具。本文通过一个全面的、定性的用户调研与实验探索了数据表格的优势以及在意义构建中是如何发挥作用的。

继续阅读 »

基于多边形的超图可视化的布局自动生成方法(Automatic Polygon Layout for Primal-Dual Visualization of Hypergraphs)

在超图中,每条边不再仅限于表示一个二元关系,而是能够表示一个任意的n元关系(n大于等于2),如果依然使用传统的点边形式(node-link)对超图进行可视化,那么每一条边都将被表示为一个团的结构,这会带来大量的边,导致视觉聚集,从而干扰用户对图结构的认知过程。本文提出了使用多边形来对超边进行可视化的方法(图1),并最终给出了一种支持对偶视图形式的自动布局算法。

继续阅读 »

VIS30K: IEEE国际可视化大会论文的图表集合(VIS30K: A Collection of Figures and Tables from IEEE Visualization Conference Publications )

可视化是一个依赖于图像和视频来展示和解释研究工作的学科。在可视化论文中,图像是必要的部分,能够帮助我们理解复杂的科学概念。而浏览一个领域的图像可以很好地揭示时间趋势和常见的实践,且可以对子学科进行比较。本工作从可视化领域的顶级会议IEEE国际可视化大会 (IEEE VIS)收集了近三十年的接近三万张图表,并开发了一个图片浏览工具。

继续阅读 »

源-目的地数据可视化的设计空间(Design Space of Origin-Destination Data Visualization)

可视化是观察和分析源-目的地 (Origin-Destination) 数据的重要工具,分析多个地理空间点之间的流数据,应用在有关通勤、迁移和货物运输中。流向图(flow map)是OD数据分析最常用的可视化方法,然而经常会遇到混乱和遮挡的问题。为了解决这些问题,许多可视化方法采用数据抽象和视觉抽象,例如进行节点聚合或边缘捆绑​​,从而导致信息丢失。最近可视化的理论和经验发展[2]证实了这种抽象方法的优点,同时证实了观众的知识可以减轻由于信息丢失造成的负面影响。探索源-目的地数据可视化的设计空间需要了解在数据和视觉抽象中丢失和添加信息的不同方式。该工作[1]基于数据抽象和视觉抽象中对源-目的地数据的信息操作的分类,制定了源-目的地可视化的新设计空间。依据该设计空间,提出了基于半边编码和饼图的源-目的地数据的可视化方法。

继续阅读 »

Sequen-C:时序事件序列的多层级概览(Sequen-C: A Multilevel Overview of Temporal Event Sequences)

已有很多有关事件序列的可视分析工作,他们大多从给定用户事件序列的概览出发,并在用户探索的过程中给予细节。但是,现有的相关可视分析系统往往只会给用户单一的概览作为探索的起点,而这可能会遗漏一些发现。系统应允许用户改变概览的详细程度。

而本文[1]则从事件序列的垂直和水平方向提出了构建多层级概览的方法,在垂直方向进行事件序列的聚类,而在水平方向进行事件序列集合不同程度的压缩。此外,对于这些不同层级的概览,用户很难决定从哪一个入手进行探索。因此该工作也提供了一些可能最优的概览供用户进行选择。最后,该工作提出了一个可视分析系统Sequen-C来支持用户多层级的探索。

继续阅读 »

Nebula:构建交互联动的图形语法(Nebula: A Coordinating Grammar of Graphics)

在多视图联动的可视化系统(MCV)中,不同视图会根据用户在其他视图中的交互和联动更新其内容。交互式创作系统(Interactive systems)提供直接的操作来创建视图之间的交互,但仅限于一定类型的预定义模板;基于文本的规范语法(Textual specification languages)支持灵活的交互创作,但对用户的技术水平有较高要求。本文提出一种基于自然语言的语法,用以创建多视图联动可视化的框架Nebula。该框架通过演示实例来描述视图联动效果,如图1所示。

继续阅读 »

用于比较分析的交互式降维(Interactive Dimensionality Reduction for Comparative Analysis)

比较数据中的两个群组或者多个群组以确定使这些群组彼此相同或不同的因素是一项常见的分析任务。对于高维数据,降维方法经常被用来寻找每个群组的特征。然而,现有的降维方法进行比较分析的能力和灵活性有限。比如,无监督降维方法(如PCA)在计算时不会考虑数据的标签信息,有监督降维方法分析的目标较为狭窄(如LDA只识别最能区分群组的因素)。另外,大多数降维方法都不允许用户进行观察层面的交互,这极大限制了比较的灵活性。为了解决这些问题,作者提出新的降维方法ULCA(unified linear comparative analysis)和交互式降维框架 [1]。

继续阅读 »

DIEL:用于交互式可视化的透明延拓(DIEL: Transparent Scaling for Interactive Visualization)

在数据规模逐渐膨胀的当下,基于网页端的交互可视化,不再能够把所有的数据存储在内存中并处理。为了能更好得与大规模数据沟通,可视化的应用也需要一个强大的后端支撑。当前端的交互可视化遇上后端数据库服务,开发者面临着许多新兴的问题,例如交互逻辑到API以及数据库查询的映射,非同步的请求响应处理,以及缓存数据优化等等。本文的核心想法就是希望提出一个通用的框架,来帮助开发者透明得编写前端交互可视化,自动地处理上述问题。

继续阅读 »

为可视化集合中的可视化生成具有代表性的缩略视图(VizSnippets: Compressing Visualization Bundles Into Representative Previews for Browsing Visualization Collections)

当用户需要在一个包含许多个可视化的可视化集合中(例如Observable或Tableau)进行检索时,好的缩略图能够帮助用户快速地判断一个可视化和他的实际检索目标的关联,从而快速筛查候选结果,较大地提升用户检索的效率。然而在当前的许多可视化创作与分享网站上,可视化的缩略图生成方法是存在较大缺陷的。本次我们将要介绍的工作VizSnippets就针对这些问题从图片选择和文本关键字选择两个方面提出了一个自动化的可视化缩略视图生成方法。

继续阅读 »

收集和表征指定数据可视化的自然语句(Collecting and Characterizing Natural Language Utterances for Specifying Data Visualizations)

自然语言 (natural language, NL) 作为数据可视化工具的输入模式越来越受到关注。 许多商业可视化系统工具(例如 Microsoft Power BI 、Tableau 等)和研究方法都展示了自然语言接口支持更广泛的受众进行可视分析的潜力。对自然语句的分析理解对这些工具而言非常重要,然而已有的工作通常缺乏对用户如何使用自然语言指定生成可视化的过程缺乏足够的理解。

继续阅读 »