作者存档: Jiang, Ruike Jiang

Charagraph: 包含数据信息段落的实时标注和交互式图表生成(Charagraph: Interactive Generation of Charts for Realtime Annotation of Data-Rich Paragraphs)

科学论文、数据报告、调查报告等文本通常包含丰富的数据信息。由于图表的设计和生成需要专业的知识和经验以及文档存在空间限制等原因,很多数据信息使用纯文本信息而非图表来展示。用户很难通过数字来提取、比较和理解复杂数据,即使对于图表,也可能因为文本和图表分散于文档的不同部分而难以将它们关联起来。来自滑铁卢大学和里尔大学的研究者提出了Charagraph [1],支持用户交互式标注文档中的数据信息和生成可视化图表。

继续阅读 »

使用SOMNUS来可视化数据清洗脚本 (Visualizing the Scripts of Data Wrangling with SOMNUS)

理解数据变换代码对数据工作者是非常重要的任务。然而完成这项任务需要熟练掌握编程技能和充分了解代码使用的编程语言和库。同时,理解代码的过程耗时且容易出错。现有的代码可视化工作专注于提供中间状态信息,而不支持对数据变换过程的呈现。

继续阅读 »

从惊讶到好奇:创建电影风格的数据视频开场的指导方针 (From ‘Wow’ to ‘Why’: Guidelines for Creating the Opening of a Data Video with Cinematic Styles)

数据视频是常见的数据故事叙述的形式,它结合了视听两方面内容,例如动画、镜头移动、音乐、旁白等形式,传达数据洞察。由于人们的时间和注意力有限,数据视频的开场对观众是否有兴趣看完整个视频有重要的影响。电影风格的数据视频开场可以吸引用户的注意,使他们愿意进一步了解现象背后的原因。但是目前缺少关于创建此类数据视频开场的指导原则。来自香港科技大学和北京师范大学的Xian Xu等人 [1]提出了可以用于数据视频开场的电影风格和指导方针,发表在CHI 2022。

继续阅读 »

从计算笔记本讲述故事:人工智能辅助的用于数据科学展示的幻灯片制作 (Telling Stories from Computational Notebooks: AI-Assisted Presentation Slides Creation for Presenting Data Science Work)

数据科学项目既包括数据获取、清洗、建模等技术工作,也包括技术人员和非技术人员的高度合作。例如,数据科学家在构建模型之后,需要向项目相关者展示模型,并从他们那里收集反馈和获得支持。这一过程需要从复杂的代码中定位和提取关键信息,将这些信息组织成数据故事,同时还要根据观众背景的差异改变展示的方式。数据科学家需要耗费大量时间,且容易出错。来自香港科技大学、IBM研究院和密歇根大学的Zheng等人 [1]提出了以用户为中心、人工智能辅助的模型展示幻灯片的制作系统,帮助数据科学家提高效率。

继续阅读 »

响应式可视化的任务导向洞察的自动推理方法 (An Automated Approach to Reasoning About Task-Oriented Insights in Responsive Visualization)

由于移动设备的普及,可视化创作者需要考虑可视化在不同设备上的显示,即响应式可视化。通常,创作者实现针对桌面环境的可视化之后,通过改变大小、进行数据聚合等方法调整可视化以适应移动设备。然而,这一过程会改变原始的可视化传达的信息,需要创作者不断尝试不同设计,并考虑它们保留的信息,这一过程困难且繁琐。

继续阅读 »

2021年北京大学可视化发展前沿研究生暑期学校 – Day 5

今天(2021年7月19日)的课程是由来自马里兰大学的Zhicheng Liu教授带来的主题为可视化设计中的概念、方法与工具,来自蒙纳士大学Tim Dwyer教授讲授的图可视化和来自塔夫茨大学的Remco Chang教授关于用户分析和交互式机器学习的内容。

继续阅读 »

解释装饰对于可视化的影响 (Interpreting the Effect of Embellishment on Chart Visualizations)

可视化和信息图传达数据故事,广泛应用于科学研究和社会生活。信息图的设计风格多样,既可以是极简主义的可视化,只包含原始数据相关的元素;也可以是经过精心装饰的可视化,以更好地吸引可视化读者。然而,长久以来,研究者在信息图装饰的作用上存在争论。

继续阅读 »

IEEE PacificVis 2021 机器学习和自动可视化专题(Machine Learning and Automated Visualization)

IEEE PacificVis 2021 机器学习和自动可视化专题(Machine Learning and Automated Visualization)以及可视化遇到AI专题(Visualization Meets AI)共报告五个工作,分别是关于将机器学习运用到图布局偏好预测、自动可视化问答、单元可视化的滚动叙述生成、基于图标检测训练对信息图进行解析和总结,以及使用文档嵌入和降维展示主题演变。其中,来自北京大学可视化与可视分析实验室的自动可视化工作ADVISor的具体介绍在http://vis.pku.edu.cn/blog/advisor/

继续阅读 »

IEEE PacificVis 2021 主题报告II

第二个主题报告的题目是《可视数据科学-通过计算与交互应对挑战性数据场景(Visual Data Science – Integrating Computation with Interaction to Master Challenging Data Scenarios)》,报告的嘉宾是挪威卑尔根大学的Helwig Hauser教授。Helwig Hauser是挪威卑尔根大学可视化教授和数据科学中心CEDAS的负责人,关注数据科学的跨学科研究,以及数据科学教育和应用。在信息时代,研究者以及相关从业人员需要处理大量复杂的数据,包括多维集合数据集、流数据等。为了应对这样的挑战,越来越多的学科通过交叉合作的方式来发挥各自优势。可视数据科学即将交互式可视化与机器学习、统计等方法巧妙结合起来,让专家参与决策过程。Hauser教授的报告分为三个部分,第一部分是对数据科学、可视化数据科学概念的介绍,第二部分讨论其中的相关研究问题,包括高维数据分析、模型修正、可视化交互等,第三部分是对于开展交叉学科研究的心得和展望。

继续阅读 »

P5: 针对交互式数据分析和可视化的便携渐进式并行处理流水线(P5: Portable Progressive Parallel Processing Pipelines for Interactive Data Analysis and Visualization)

交互式数据分析面临的数据,体量越来越大,复杂度越来越高,导致数据转换和可视化渲染的延迟提高,这将会阻碍用户交互分析的效率。现有的应对方式包括应用并行处理等方法提高计算速度,以及通过渐进式可视化方法,使用户能快速获得对中间结果的感知。但是大部分现有的可视化工具包,不能支持应用高性能计算方法,并且提供渐进式可视化创建的能力。该工作提供了P5这一创建渐进式可视化的可视化工具包,它提供了声明式的可视化生成方式和使用GPU计算资源的功能。

继续阅读 »