分类存档: 研究

支持在探索性数据分析中对数据进行比较(Diff in the Loop: Supporting Data Comparison in Exploratory Data Analysis)

在做数据分析时,研究者需要对数据进行变换、聚类或者过滤等操作来使得数据满足分析任务的需求。在这个过程中,不仅处理数据的代码会发生变化,数据本身也会发生变化。然而已有工具都是追踪处理过程中代码的变化,不能够告诉用户经过这些代码处理后,数据如何发生变化。这篇论文设计了一个工具,支持数据探索分析中对数据变化的追踪。

继续阅读 »

多属性矩阵可视化的交互技术评估 (The Pattern is in the Details: An Evaluation of Interaction Techniques for Locating, Searching, and Contextualizing Details in Multivariate Matrix Visualizations)

矩阵是一种常见的可视化技术,广泛应用在网络、表格、时序等数据可视化中。矩阵通过紧凑的二维网格布局形式来可视化大规模数据,网格中的每个单元表示一个数据项,通过颜色或者大小编码数据项的某个值。然而,对于多属性矩阵来说,一个数据项会包含多个值,如多个属性、多个时间值,如何有效展现这些细节面临着重大挑战。已有可视化方法通过在网格中嵌入图元的方式来展现每个数据项的细节,但是这些方法需要大量空间,难以可视化大规模矩阵。另一种方法是通过交互技术,有选择的展现一部分数据的细节信息。然而交互技术多种多样,哪些适合多属性矩阵可视化?这篇文章对于相关的交互技术进行了评估。

继续阅读 »

从计算笔记本讲述故事:人工智能辅助的用于数据科学展示的幻灯片制作 (Telling Stories from Computational Notebooks: AI-Assisted Presentation Slides Creation for Presenting Data Science Work)

数据科学项目既包括数据获取、清洗、建模等技术工作,也包括技术人员和非技术人员的高度合作。例如,数据科学家在构建模型之后,需要向项目相关者展示模型,并从他们那里收集反馈和获得支持。这一过程需要从复杂的代码中定位和提取关键信息,将这些信息组织成数据故事,同时还要根据观众背景的差异改变展示的方式。数据科学家需要耗费大量时间,且容易出错。来自香港科技大学、IBM研究院和密歇根大学的Zheng等人 [1]提出了以用户为中心、人工智能辅助的模型展示幻灯片的制作系统,帮助数据科学家提高效率。

继续阅读 »

2021年新当选院士分布可视化

11月18日,中国科学院、中国工程院2021年院士增选结果公布,共有149人当选。其中,中国科学院增选院士65人,中国工程院增选院士84人。两院院士是我国在科学技术领域设立的最高学术称号,其增选结果从侧面反映出各单位当前在顶级科研人才方面的储备情况,受到社会各界的广泛关注。

继续阅读 »

探索交互日志来减轻人的偏见(Left, Right, and Gender: Exploring Interaction Traces to Mitigate Human Biases)

偏见影响着人们分析数据的方式和决策的结果。在可视分析系统中,人的偏见会体现在只对部分数据进行分析而进行决策,使得决策产生偏差。该工作研究如何通过可视化用户的交互历史(用户与哪些数据点和属性进行了交互),来降低人在可视化系统探索过程以及决策时的潜在偏见。

继续阅读 »

解释装饰对于可视化的影响 (Interpreting the Effect of Embellishment on Chart Visualizations)

可视化和信息图传达数据故事,广泛应用于科学研究和社会生活。信息图的设计风格多样,既可以是极简主义的可视化,只包含原始数据相关的元素;也可以是经过精心装饰的可视化,以更好地吸引可视化读者。然而,长久以来,研究者在信息图装饰的作用上存在争论。

继续阅读 »

对探索性可视分析中分析关注点进行建模和使用(Modeling and Leveraging Analytic Focus During Exploratory Visual Analysis)

可视分析系统通过对数据的图形化表示和灵活的交互方式让用户能够分析、发现数据中的规律。然而用户对于这些发现的理解和解释往往需要一些外部的知识(context),这篇论文[1]通过对于用户在数据分析过程中的关注点(analytics focus)进行建模和计算的方式,自动给用户推荐相关的外部知识来帮助用户对于数据的理解。

继续阅读 »

IEEE PacificVis 2021 机器学习和自动可视化专题(Machine Learning and Automated Visualization)

IEEE PacificVis 2021 机器学习和自动可视化专题(Machine Learning and Automated Visualization)以及可视化遇到AI专题(Visualization Meets AI)共报告五个工作,分别是关于将机器学习运用到图布局偏好预测、自动可视化问答、单元可视化的滚动叙述生成、基于图标检测训练对信息图进行解析和总结,以及使用文档嵌入和降维展示主题演变。其中,来自北京大学可视化与可视分析实验室的自动可视化工作ADVISor的具体介绍在http://vis.pku.edu.cn/blog/advisor/

继续阅读 »

ADVISOR: 表格数据自然语言问询的自动可视化回答(ADVISor: Automatic Visualization Answer for Natural-Language Question on Tabular Data)

近年来,人们对数据分析的需求不断增长。而生成可视化是展示、分析数据特征的重要手段。无论是学术论文还是数据新闻,可视化在对数据的分析中都扮演着重要角色。由于其广泛的需求,一些商业工具如PowerBI 等可以根据用户在数据表格中指定特定的行或者列以生成可视化结果。然而,构造相应的可视化需要用户在数据和可视化方面具有一定的专业知识以决定选择相应的数据和可视化的类型。

这些工具依赖于用户具有的数据或者可视化的一定门槛。不同于编程或者使用特定可视化构建工具固有的学习成本,人类用户天然掌握一种低门槛的交流方式——自然语言。利用自然语言来表述用户的数据分析需求天然地降低了用户的使用门槛。基于此,北京大学可视化与可视分析研究组刘灿、韩云等 [1] 提出了一种从自然语言问题和表格出发,构建可视化及附加高亮为结果的方法。该方法全文发表于2021 IEEE 太平洋可视化会议(IEEE Pacific Visualization Symposium)。

继续阅读 »

欢迎参与全球 COVID-19 可视化数据收集工作

在过去的一年,COVID-19疫情的新闻占据了全球所有新闻的头版头条,可视化则是各类新闻或者材料中了解疫情情况重要的途径。美国工程院院士、可视化知名学者Ben Shneiderman教授在2020年4月写的一篇题为《Data Visualization’s Breakthrough Moment in the COVID-19 Crisis》的博客中指出,可视化这个学科在今天(疫情期间)的影响远远超越了它在300年来的发展历史中作出的其他重要的贡献。无论是官方机构还是媒体,都纷纷使用可视化传播和表达疫情中各类关键信息。

继续阅读 »