作者存档: Chufan Lai

自动可视化注释动画生成

基于文本描述的可视化自动注释

在数据分析过程中,人们会获得各种发现与洞见。当他们分享这些洞见时,可视化图表常常扮演着重要的角色。然而,如何高效地引导观众理解数据,却不是一件简单的事情。在演讲者描述图表的同时,观众需要在图和描述之间频繁切换,并进行视觉和语义信息的匹配。这一过程乏味且耗时,甚至会阻碍观众跟上讲演的思路。

一种有效的辅助读图手段是高亮与注释。针对每一句描述,我们可以高亮被描述的图中实体,并将描述文本附着于实体旁边,从而绑定视觉与语义信息,并快速吸引观众注意力。然而,高亮注释的工作耗时费力,极大地增加了演讲者的工作负担。

针对这一问题,北京大学可视化与可视分析实验室袁晓如团队近期提出一种自动生成图表高亮与注释效果的方法。用户只需上传图表及相应的描述,即可在顷刻间获得准确而生动的、带高亮与注释效果的动画,以辅助数据信息的展现。这项成果发表于ACM CHI 2020。

继续阅读 »

IGAL可视化讲习班-4:任务驱动的自动可视化构建 – 汪云海

讲习班首日下午的第二位讲者是来自山东大学的汪云海教授。他大家带来了题为《任务驱动的自动可视化构建(Task-driven Automated Visualization)》的讲座。

继续阅读 »

SIRIUS:交互式对称双向降维技术(SIRIUS: Dual, Symmetric, Interactive Dimension Reductions)

在经典的降维技术中,维度(attributes)一般被视作输入而数据(observations)作为输出,用户通过与数据投影进行交互来了解数据与维度之间的关联。但在许多分析场景中,两者地位平等、相互影响、密不可分。通过分析数据之间的关系,能够揭示维度的重要性与价值,反之亦然。例如在区分西瓜与梨子时,“尺寸”是十分重要的因素。又如在强调糖分与水分的相关性时,“西瓜”便比“糖葫芦”更有说服力。为了帮助用户进行数据与维度的双向关联性分析,这篇发表于IEEE VIS 2018的文章[1]提出了SIRIUS(Symmetric Interactive Representations In a Unified System):即同一系统下的交互性对称双向降维技术。

继续阅读 »

文本搜索功能对于网页端可视化的作用(The Effects of Adding Search Functionality to Interactive Visualizations on the Web)

文本搜索功能对于网页端可视化的作用

基于文本的搜索被广泛应用于各类信息检索的场景中。但受限于数据类型、交互场景等,各式网页端可视化作品却鲜少提供基于文本的搜索功能。这篇发表于CHI 2018的文章[1]通过对照实验,研究了文本搜索功能在网页端可视化中、对于用户探索与分析数据所带来的具体影响。

继续阅读 »

对TensorFlow中数据流图的可视分析(Visualizing Dataflow Graphs of Deep Learning Models in TensorFlow)

对TensorFlow中数据流图的可视分析

TensorFlow是谷歌开发的、当下最流行的机器学习软件库之一。它采用数据流图(Dataflow Graph)来表达机器学习算法的计算过程,用户可以定制不同的数据流图来构建自己的算法。然而,随着深度学习的兴起与流行,各类神经网络渐趋大规模、复杂化。算法开发者仅凭借自身的理解与记忆、很难把握算法的各部分体系结构,相互之间也难以进行沟通。为此,这篇文章[1]提出了可视化工具TensorFlow Graph Visualizer,通过可视分析帮助用户在TensorFlow中进行算法分析与开发。值得一提的是,该文章荣获了IEEE VAST 2017的最佳论文奖(Best Paper Award)。

继续阅读 »

在可视分析中系统地结合降维投影与聚类方法(Towards a Systematic Combination of Dimension Reduction and Clustering in Visual Analytics)

在可视分析中系统地结合降维投影与聚类方法

在高维数据分析中,聚类(Clustering)与降维(Dimension Reduction)都是常用的机器学习方法。前者尝试对数据进行归纳分类,而后者则试图压缩维度并尽可能地保留分布信息。可视分析往往结合两者的优点,以帮助用户更好地挖掘数据隐含的信息。在具体应用中,我们应该如何挑选聚类和降维方法呢?两者的结合都有哪些因素需要考虑,又有哪几种不同的方案呢?这篇发表于IEEE VAST 2017的文章[1] 便系统地探讨了这些问题。

继续阅读 »

Pattern Trails: 对子空间中数据变化的可视分析(Pattern Trails: Visual Analysis of Pattern Transitions in Subspaces)

在高维数据中,任意维度的组合都形成一个子空间,数据关系则因维度考量的不同而发生改变。举例来说,虎与狼在肉食性、体型、栖息地等方面相近,但在基因组成、群聚性上,虎与猫则更为相近。然而,维度的组合极其繁多,其数量随维度的增多而呈指数级增长。对于如此大量的子空间,我们该如何发掘其中数据关系的变化呢?针对该问题,这篇发表于IEEE VAST 2017的文章[1]提出了Pattern Trails,一种基于可视化的交互式分析方法。

继续阅读 »

DSPCP:在平行坐标中展现复杂数据关系(DSPCP: A Data Scalable Approach for Identifying Relationships in Parallel Coordinates)

DSPCP:在平行坐标中展现复杂数据关系

平行坐标是一种高效而常用的、展现高维数据分布的可视化方法。其形式简洁、可扩展性强,有着同类方法难以比拟的优势。然而,平行坐标也存在不少缺点,形式不直观便是其中重要的一项。用户通过观察折线分布,仅能感知两个维度之间的线性相关性,而且往往会高估其中的正相关关系[2]。这篇发表在2017年TVCG上的文章[1],则巧妙地利用了平行坐标的点线对称性,增强了平行坐标表现复杂数据关系的能力与准确性。

继续阅读 »

通过可视化分析地理因素对多变量聚类的影响(Visualizing the Impact of Geographical Variations on Multivariate Clustering)

通过可视化分析地理因素对多变量聚类的影响

多变量地理空间数据是一种十分常见的数据类型,例如对各大城市的人口状况统计、世界各国的国力评判指标等等。如何分析地理因素(如地域的位置、范围、方向等)对多变量数据的影响,一直是地理信息、可视分析等领域的重要课题。另一方面,聚类是简化多变量分析的常用方法,它能够挖掘相似数据、总结数据特征、并消除变量增长所带来的负担。然而,当下的聚类分析方法并没有考虑地理因素的影响。这篇发表于2016年EuroVis会议的文章[1],就探讨了如何通过可视化分析地理因素对多变量聚类的影响。

继续阅读 »

IEEE Pacific Visualization Symposium 2017 – Day 0

国际可视化盛会之一的IEEE PacificVis 2017,于4月18日到21日在韩国首尔大学举行。会议首日是PacificVAST研讨会,邀请了众多可视化领域的著名专家学者前来作报告。会议内容共包含两个主题报告(Keynote Talk)、四个邀请报告(Invited Talk),以及一个讨论环节(Panel Discussion)。

继续阅读 »