
在做数据分析时,研究者需要对数据进行变换、聚类或者过滤等操作来使得数据满足分析任务的需求。在这个过程中,不仅处理数据的代码会发生变化,数据本身也会发生变化。然而已有工具都是追踪处理过程中代码的变化,不能够告诉用户经过这些代码处理后,数据如何发生变化。这篇论文设计了一个工具,支持数据探索分析中对数据变化的追踪。
继续阅读 »在做数据分析时,研究者需要对数据进行变换、聚类或者过滤等操作来使得数据满足分析任务的需求。在这个过程中,不仅处理数据的代码会发生变化,数据本身也会发生变化。然而已有工具都是追踪处理过程中代码的变化,不能够告诉用户经过这些代码处理后,数据如何发生变化。这篇论文设计了一个工具,支持数据探索分析中对数据变化的追踪。
继续阅读 »矩阵是一种常见的可视化技术,广泛应用在网络、表格、时序等数据可视化中。矩阵通过紧凑的二维网格布局形式来可视化大规模数据,网格中的每个单元表示一个数据项,通过颜色或者大小编码数据项的某个值。然而,对于多属性矩阵来说,一个数据项会包含多个值,如多个属性、多个时间值,如何有效展现这些细节面临着重大挑战。已有可视化方法通过在网格中嵌入图元的方式来展现每个数据项的细节,但是这些方法需要大量空间,难以可视化大规模矩阵。另一种方法是通过交互技术,有选择的展现一部分数据的细节信息。然而交互技术多种多样,哪些适合多属性矩阵可视化?这篇文章对于相关的交互技术进行了评估。
继续阅读 »数据科学项目既包括数据获取、清洗、建模等技术工作,也包括技术人员和非技术人员的高度合作。例如,数据科学家在构建模型之后,需要向项目相关者展示模型,并从他们那里收集反馈和获得支持。这一过程需要从复杂的代码中定位和提取关键信息,将这些信息组织成数据故事,同时还要根据观众背景的差异改变展示的方式。数据科学家需要耗费大量时间,且容易出错。来自香港科技大学、IBM研究院和密歇根大学的Zheng等人 [1]提出了以用户为中心、人工智能辅助的模型展示幻灯片的制作系统,帮助数据科学家提高效率。
继续阅读 »11月18日,中国科学院、中国工程院2021年院士增选结果公布,共有149人当选。其中,中国科学院增选院士65人,中国工程院增选院士84人。两院院士是我国在科学技术领域设立的最高学术称号,其增选结果从侧面反映出各单位当前在顶级科研人才方面的储备情况,受到社会各界的广泛关注。
继续阅读 »偏见影响着人们分析数据的方式和决策的结果。在可视分析系统中,人的偏见会体现在只对部分数据进行分析而进行决策,使得决策产生偏差。该工作研究如何通过可视化用户的交互历史(用户与哪些数据点和属性进行了交互),来降低人在可视化系统探索过程以及决策时的潜在偏见。
继续阅读 »可视化和信息图传达数据故事,广泛应用于科学研究和社会生活。信息图的设计风格多样,既可以是极简主义的可视化,只包含原始数据相关的元素;也可以是经过精心装饰的可视化,以更好地吸引可视化读者。然而,长久以来,研究者在信息图装饰的作用上存在争论。
可视分析系统通过对数据的图形化表示和灵活的交互方式让用户能够分析、发现数据中的规律。然而用户对于这些发现的理解和解释往往需要一些外部的知识(context),这篇论文[1]通过对于用户在数据分析过程中的关注点(analytics focus)进行建模和计算的方式,自动给用户推荐相关的外部知识来帮助用户对于数据的理解。
继续阅读 »IEEE PacificVis 2021 机器学习和自动可视化专题(Machine Learning and Automated Visualization)以及可视化遇到AI专题(Visualization Meets AI)共报告五个工作,分别是关于将机器学习运用到图布局偏好预测、自动可视化问答、单元可视化的滚动叙述生成、基于图标检测训练对信息图进行解析和总结,以及使用文档嵌入和降维展示主题演变。其中,来自北京大学可视化与可视分析实验室的自动可视化工作ADVISor的具体介绍在http://vis.pku.edu.cn/blog/advisor/。
继续阅读 »在过去的一年,COVID-19疫情的新闻占据了全球所有新闻的头版头条,可视化则是各类新闻或者材料中了解疫情情况重要的途径。美国工程院院士、可视化知名学者Ben Shneiderman教授在2020年4月写的一篇题为《Data Visualization’s Breakthrough Moment in the COVID-19 Crisis》的博客中指出,可视化这个学科在今天(疫情期间)的影响远远超越了它在300年来的发展历史中作出的其他重要的贡献。无论是官方机构还是媒体,都纷纷使用可视化传播和表达疫情中各类关键信息。
继续阅读 »
近期评论