分类存档: 论文报告

基于自然语言的可视化构建方法(Towards Natural Language-Based Visualization Authoring)

为了让用户更快更好地熟悉和使用复杂的系统,可以使用自然语言代替传统的用户交互界面。这一类交互界面被称为自然语言界面(Nature Language Interface),并已经被广泛地在各类可视分析系统中使用。相比之下,很少有工作将这一技术应用在构建可视化的系统中。事实上,无论是分析导向的系统还是构建导向的系统,在工作流程上有极大的相似之处。下图展示对比了将自然语言处理技术应用在两类系统中的具体流程。

继续阅读 »

将人类知识纳入数据嵌入以提高模式显著性和可解释性(Incorporation of Human Knowledge into Data Embeddings to Improve Pattern Significance and Interpretability)

降维是一种常用的高维数据可视化方法,它将高维数据投影到低维空间,在产生的投影中保留原始数据的特定特征。降维的典型分析过程分为两步。用户首先寻找投影中特殊的视觉结构(如离群值和聚类),然后解释每个视觉结构中的模式。然而,显著和可解释的结构并非总是存在。这会导致用户的后续分析难以开展。另一方面,用户知识可用于提高模式显著性和可解释性,从而构建结果驱动的分析流程。知识指的是用户对目标数据集的整体理解,这来自于他们的经验。这篇文章 [1]提出一种实现基于知识数据分析的嵌入方法。

继续阅读 »

MosaicSets:网格图上的集合可视化(MosaicSets: Embedding Set Systems into Grid Graphs)

集合可视化是信息可视化的一个重要研究领域。对于抽象集合系统的可视化,一种常用的方法是欧拉图,但是它通常侧重于集合关系而不关注其中的单个元素。来自德国波恩大学和维也纳技术大学的研究人员提出了MosaicSets [1],一种将给定的集合系统嵌入到规定的网格图中的可视化方法。如图1所示,该可视化包括基本地图(Base map)和覆盖(Overlay)两部分组成,基本地图中的相同颜色的节点属于同一个集合,覆盖中由一种颜色的边框包围的节点属于同一个集合。

继续阅读 »

使用递归最优对应性进行层次结构布局的插值(Hierarchical Layout Blending with Recursive Optimal Correspondence)

布局生成是一类重要的问题。在现有的布局生成相关研究中,一类研究注重与提供各类辅助工具,帮助设计师设计排版布局,例如各类交互的布局指令[1],自动吸附工具[2],以及更加高级的对齐关系推断与优化系统[3]等,但要使用这一类工具创作高质量的布局还是需要依赖设计师的专业知识。而另一类则是自动布局生成工具,但在这一类工具中,使用规则的布局生成方法产生的结果多样性不足,而基于学习的生成方法[4]则依赖于大规模高质量的数据集。

来自深圳大学的Pengfei Xu在发表于SIGGRAPH ASIA 2022的论文《Hierarchical Layout Blending with Recursive Optimal Correspondence》[5]中提出了基于少量布局样本,使用混合插值方法从样本中生成新布局的方法,并提出了一种支持平滑的布局插值的算法(图1)。

继续阅读 »

CohortVA:基于历史数据的群体交互探索可视化分析系统(CohortVA: A Visual Analytic System for Interactive Exploration of Cohorts based on Historical Data)

在历史研究中,群体是指从事共同活动或频繁互动的一群人物,历史学家通过研究历史人物的行为来探讨社会结构的变化和社会流动的趋势。传统的历史群体分析耗费大量的精力和时间,而现有的自动数据挖掘方法则缺乏有效的视觉解释。对此,来自浙江大学的Wei Zhang等人[1]通过与历史学家合作,提出了一种交互式的可视分析方法——CohortVA,使得历史学家能够将专业知识和洞察纳入迭代探索群体的过程中,极大地提高群体识别、人物筛选和假设验证的能力。该论文发表于VIS 2022。

继续阅读 »

通过交互打破数据故事的第四面墙 (Breaking the Fourth Wall of Data Stories Through Interaction)

打破第四面墙(BTFW)源于戏剧和文学作品。指故事中的角色走出故事里的世界,意识到观众的存在,直接与读者或观众对话。在数据故事中,BTFW作为一种叙事手段可以与交互结合,从而在用户和数据故事之间建立更深层的联系。可视化中的BTFW通过直接对话用户或请求用户信息将用户的个人情况整合到可视化叙事中。该工作分析了当下数据故事中使用BTFW交互的优势和挑战,并且探索了数据故事中常用的BTFW交互设计模式 [1]。

继续阅读 »

DashBot: 基于深度强化学习的见解驱动的仪表盘生成 (DashBot: Insight-Driven Dashboard Generation Based on Deep Reinforcement Learning)

分析仪表盘在商业智能中广受欢迎,其通过多个可视化图表表达数据,支持见解发现。然而构建有效的仪表盘依赖于用户具有数据分析方面的专业紧跟。用户需要选择数据属性、探索不同种类图表来配置仪表盘。这往往需要反复试错才能构建有效的仪表盘。来自浙江大学和香港科技大学的团队提出通过深度强化学习的方法, DashBot [1], 通过设计智能体网络模仿人类构建过程以自动生成分析仪表盘。图1为DashBot 生成的效果。

继续阅读 »

ChartWalk: 浏览电子健康记录中的大量文本记录以进行临床病例回顾 (ChartWalk: Navigating large collections of text notes in electronic health records for clinical chart review)

在初次接诊病人前,医护人员需要在短时间内审查病人的电子健康记录(EHR),以了解病人情况。EHR 由大量半结构化医疗文本报告组成,这些文本数据严重碎片化且冗余,不便于浏览和检索,使得病例回顾成为一个耗时、乏味的过程。来自多伦多大学的 Sultanum 等人 [1] 提出了支持病例回顾的可视分析工具 ChartWalk,帮助医护人员快速浏览、分析文本记录,发表在 VIS 2022。

继续阅读 »

Data Hunches: 将个人知识融入可视化 (Incorporating Personal Knowledge into Visualizations)

可视化中展现的数据不一定是完美的,可能存在一些错误。而对于数据质量的问题,往往只有领域专家才能觉察到。 在发现可视化中存在数据质量问题后,专家可以通过书面告知、交谈等方式进行反馈,但是这样的反馈方式非常低效。本文介绍的工作首先对于数据质量问题进行了分类,然后对于不同类型的数据质量问题,采用了基于手绘风格的形式进行可视化,让专家在原有可视化中融入自己的个人知识。

继续阅读 »

模糊电子表格:理解和探索表格计算中的不确定性(Fuzzy Spreadsheet: Understanding and Exploring Uncertainties in Tabular Calculations)

图1:Fuzzy Spreadsheet 系统界面

电子表格在人们的生活中随处可见:在自然科学、金融商务、电子信息等领域都有着广泛应用。电子表格不仅为用户提供了可靠、方便的数据浏览的方式;并且允许用户使用一些基本的函数对表格数据进行操作,方便用户进行更进一步的统计分析。然而在使用过程中稍加分析,我们可以发现,电子表格本身对于数据中的不确定性以及单元格之间诸如通过函数相连的关系缺乏一种较好的表达方式。本文基于此,提出一种通过单元格内嵌可视化的方法,对传统表格进行“增强”,从而方便地使用户在浏览一般表格数据时,还可以较好地观察到单元格之间的关联性与其内部数值的不确定性。

继续阅读 »