分类存档: 论文报告

VIBR: 通过MDL准则可视化大规模二分关系数据(Visualizing Bipartite Relations at Scale with the Minimum Description Length Principle)

对于两个集合,如果一个集合中点和另一个结合中的点有连接,而集合内的点之间没有连接,那么这样的数据称为二分关系数据。通常这样的数据通过图模型来描述,这类特殊的图称为二分图(图1)。生活中存在大量这样的二分关系数据,比如顾客购买商品,议员投票议案等。已有工作针对二分关系数据的分析仍停留在表现单个节点和边,难以处理大规模的二分关系数据。本文介绍的工作[1]使用了最小描述长度准则(Minimum Description Length Principle)来对二分数据聚合,并且提出了基于邻接链表形式的可视化方法分析二分关系数据,相比于已有方法,该方法能够更好的提供二分关系数据的概览。

继续阅读 »

一种对于灵活的体数据可视化流程的申明语法(A Declarative Grammar of Flexible Volume Visualization Pipelines)

直接体绘制是一种广为接受的可视化3D体数据的方法,通常采用统一化的流程。由于不同的体数据需要展示不同的特征,一些定制的可视化技术通常被应用。如为了强化分类的效果采用高阶的传递函数,为了更好的视觉感官采用非真实感渲染技术等,这会导致流程中的每一个步骤都可能发生改变。同时多数据场可视化同样十分重要,当需要进行混合的场的个数发生改变时,可视化的流程同样会发生改变,同时这样的改变在对于体数据初期的探索中十分常见。本文描述了一种对于灵活多变的体数据可视化流程的申明语法。

继续阅读 »

SIRIUS:交互式对称双向降维技术(SIRIUS: Dual, Symmetric, Interactive Dimension Reductions)

在经典的降维技术中,维度(attributes)一般被视作输入而数据(observations)作为输出,用户通过与数据投影进行交互来了解数据与维度之间的关联。但在许多分析场景中,两者地位平等、相互影响、密不可分。通过分析数据之间的关系,能够揭示维度的重要性与价值,反之亦然。例如在区分西瓜与梨子时,“尺寸”是十分重要的因素。又如在强调糖分与水分的相关性时,“西瓜”便比“糖葫芦”更有说服力。为了帮助用户进行数据与维度的双向关联性分析,这篇发表于IEEE VIS 2018的文章[1]提出了SIRIUS(Symmetric Interactive Representations In a Unified System):即同一系统下的交互性对称双向降维技术。

继续阅读 »

灵活文档:通过上下文可视化链接文本和表格数据来帮助文档阅读

数据丰富的文档本身就是复杂的数据集,它们由不同格式的信息组成,如文本,图形和数据表。这些额外的信息形式更有利于我们对文档中的文本叙述的理解。但是,传统的打印文档的静态布局通常会妨碍对其内容的深入理解,因为这些信息往往分散各个部分。在本文中[1],我们寻求通过将文本内容与文档中包含的数据表格相结合的上下文可视化技术来促进对这些文档的更好理解。我们解析文本内容和数据表格,使用基于关键字的匹配算法来链接这两部分,并根据读者在文档中的当前关注点来生成可视化。

继续阅读 »

针对天气预报集合模拟数据的交互式可视化框架 (An Interactive Framework for Visualization of Weather Forecast Ensembles)

集合(ensemble)模拟数据是科学可视化中的一类重要研究对象。特别是针对气象学这一特定领域。在气象学领域,气象学家经常会使用数值天气预报模型来生成集合模拟数据。通过扰动初始条件或者使用不同的预测模型公式,集合模拟数据通常由一系列数据成员组成,每一个成员都是一个标量或者矢量场。由于集合数据往往由大量的数据成员组成,并且具有较高的复杂度,研究者开始广泛使用可视化方法来评估集合数据中的固有差异和不确定性,这也成为了一个重要的研究方法。

继续阅读 »

Charticulator: 交互式构建定制的图表布局(Charticulator: Interactive Construction of Bespoke Chart Layouts)

定制的图表更具表现力,可以根据想要传递的数据洞察进行细节的设计,从而让目标用户更容易注意、理解和记忆这些图表。用户想要创建这些图表,可以使用绘图的工具,但是这些工具需要手动设置数据和属性的映射,比较低效;可以用可视化的库编写代码实现,但是用户需要有较高的编程技能;也可以使用一些交互式的可视化构建工具,但是这些一般需要用户从一些模版中进行选择,因而表现能力不足,并且提供的布局方式有限或者提供的布局构建的交互不够方便。针对已有工作存在的问题,[1]的作者们提出了Charticulator,可以灵活创建可视化布局。

继续阅读 »

Deadeye:基于双眼呈现的前注意可视化技术(Deadeye: A Novel Preattentive Visualization Technique Based on Dichoptic Presentation)

突出效果(Pop out effect)被广泛地应用于人机交互和可视化领域。一个典型的例子是,当我们使用浏览器的页面搜索功能时,被搜索到的文字会被高亮出来。突出效果基于前注意(Preattentive)视觉特征,典型的前注意视觉特征有色调、形状、闪烁等。这一类的特征能够有效地吸引人的注意,凸显出来(Pop out),在较短的时间内(通常为200-250毫秒)被人类的视觉系统识别到,并且不会随着干扰的增多而受到影响。本工作提出了一种基于双眼呈现的前注意视觉方法:Deadeye。

继续阅读 »

动态体数据线:通过空间填充曲线的三维体数据视觉比较 (Dynamic Volume Lines: Visual Comparison of 3D Volumes through Space-filling Curves)

集合数据的成员之间的比较是一项繁琐而易出错的工作,这由体数据的微妙差别导致。本工作提出了动态体数据线(Dynamic Volume Lines)以实现对一组体数据的交互可视分析。利用希尔伯特(Hilbert)空间填充曲线将三维数组线形化,希尔伯特曲线展开的过程很好地保持了空间局部性。利用此基于强度的变化绘制非线形的线图:在变化幅度的区域,通常是值得关注的区域,而变化幅度较小的区域一般为不重要的区域如背景。通过实验结果,本方法被验证了其可以识别局部的强度变化。

继续阅读 »

自动可视化生成系统:Draco(Formalizing Visualization Design Knowledge as Constraints: Actionable and Extensible Models in Draco)

本篇工作[1]介绍了一个自动生成可视化的系统Draco。用户需要输入数据集和简单的数据描述,然后根据自己的任务,输入需要编码的数据,可以指定编码的方式,Draco通过计算,得到一个优化的结果,最后通过Vege-Lite生成可视化。下图为一个简单示例。

继续阅读 »

用交互式数据事实增强可视化图表(Augmenting Visualizations with Interactive Data Facts to Facilitate Interpretation and Communication)

恰当的图表注解可辅助用户理解,如排除视觉元素的干扰,突出图表的重点特征,帮助初学者快速上手等。近期,不少的可视化工具引入了自然语言生成 (Natural Language Generation, NLG) 技术来自动生成对可视化的描述性文字,丰富界面。例如Narrative Science的QuillArria的相关产品就是常见的商业例子。然而,静态的文字与对应的图表缺乏直接的关联性,也难以适应人们分享交流的实际需求。面对以上问题,本文[1]在详尽的用户研究的基础上提出了Voder:一个将可视化与交互式自动生成描述关联的原型系统。

继续阅读 »