分类存档: 研究

CohortVA:基于历史数据的群体交互探索可视化分析系统(CohortVA: A Visual Analytic System for Interactive Exploration of Cohorts based on Historical Data)

在历史研究中,群体是指从事共同活动或频繁互动的一群人物,历史学家通过研究历史人物的行为来探讨社会结构的变化和社会流动的趋势。传统的历史群体分析耗费大量的精力和时间,而现有的自动数据挖掘方法则缺乏有效的视觉解释。对此,来自浙江大学的Wei Zhang等人[1]通过与历史学家合作,提出了一种交互式的可视分析方法——CohortVA,使得历史学家能够将专业知识和洞察纳入迭代探索群体的过程中,极大地提高群体识别、人物筛选和假设验证的能力。该论文发表于VIS 2022。

继续阅读 »

ChartWalk: 浏览电子健康记录中的大量文本记录以进行临床病例回顾 (ChartWalk: Navigating large collections of text notes in electronic health records for clinical chart review)

在初次接诊病人前,医护人员需要在短时间内审查病人的电子健康记录(EHR),以了解病人情况。EHR 由大量半结构化医疗文本报告组成,这些文本数据严重碎片化且冗余,不便于浏览和检索,使得病例回顾成为一个耗时、乏味的过程。来自多伦多大学的 Sultanum 等人 [1] 提出了支持病例回顾的可视分析工具 ChartWalk,帮助医护人员快速浏览、分析文本记录,发表在 VIS 2022。

继续阅读 »

Data Hunches: 将个人知识融入可视化 (Incorporating Personal Knowledge into Visualizations)

可视化中展现的数据不一定是完美的,可能存在一些错误。而对于数据质量的问题,往往只有领域专家才能觉察到。 在发现可视化中存在数据质量问题后,专家可以通过书面告知、交谈等方式进行反馈,但是这样的反馈方式非常低效。本文介绍的工作首先对于数据质量问题进行了分类,然后对于不同类型的数据质量问题,采用了基于手绘风格的形式进行可视化,让专家在原有可视化中融入自己的个人知识。

继续阅读 »

数据视频与动画插图的设计空间(Design Space for Data Videos and Animated Illustrations)

本期介绍的两篇文章都是关于设计空间(Design Space)的,两篇文章在讨论的内容及写作风格中有一定的共通之处,因此放在一起讨论与比较。

数据视频是叙事可视化的一种体裁,将可视化与运动图形结合在一起,以讲述数据驱动的故事,在创作数据视频时,设计师经常使用动画编码数据属性,来揭示关系,显示不确定性或传达情绪。

动画插图是图形设计的一种体裁,可以使用动态视觉效果传达特定的上下文化消息。作为一种新兴媒介,动画插图通常使用动态视觉效果展示故事,通常持续不到15秒。

来自同济大学的研究团队对82个数据视频及121个高质量动画插图进行分析,总结出了这两种叙事媒介的设计空间。

继续阅读 »

仪表盘设计模式(Dashboard Design Patterns)

仪表盘是一种使用多个视图来显示同一主题的数据的可视化。自仪表盘问世以来,它被广泛应用于商业、医院、城市分析等各种应用领域。仪表盘的现有工作主要集中在高层次的抽象的指南上。例如,尽量避免向观众提供过多的信息。但是,创建者很难仅使用这些抽象指南来构建仪表盘,因为它缺少仪表盘中可视化组件的详细介绍以及如何组合它们。

由爱丁堡大学等机构的合作研究通过分析超过100个仪表盘,总结出仪表盘的设计模式,以帮助探索和理解设计选择,并作为快速仪表盘设计的指南。

继续阅读 »

经籍览观:览录而知旨,观目而悉词

中国的图书分类历史源远流长,唐初官修目录《隋书 · 经籍志》是第一部正式使用“经、史、子、集”四部分类法进行分类的目录。除《隋书 · 经籍志》外,《旧唐书 · 经籍志》《新唐书 · 艺文志》《宋史 · 艺文志》也都是官修史书的图书分类目录,不仅在时间上具有连续性,也延续了 “经、史、子、集”四部分类法。另有一部《日本国见在书目录》,记录了日本国平安前期为止的传世的汉籍总目录。该书借鉴《隋书 · 经籍志》,成书虽晚于 《隋书 · 经籍志》 ,却早于《旧唐书 · 经籍志》,所著内容与国内官修史书目录可以相互补充,同样具备极高的研究价值。 通过对这五部目录的研究,可以窥得我国古代书籍分类之一隅。

继续阅读 »

支持在探索性数据分析中对数据进行比较(Diff in the Loop: Supporting Data Comparison in Exploratory Data Analysis)

在做数据分析时,研究者需要对数据进行变换、聚类或者过滤等操作来使得数据满足分析任务的需求。在这个过程中,不仅处理数据的代码会发生变化,数据本身也会发生变化。然而已有工具都是追踪处理过程中代码的变化,不能够告诉用户经过这些代码处理后,数据如何发生变化。这篇论文设计了一个工具,支持数据探索分析中对数据变化的追踪。

继续阅读 »

多属性矩阵可视化的交互技术评估 (The Pattern is in the Details: An Evaluation of Interaction Techniques for Locating, Searching, and Contextualizing Details in Multivariate Matrix Visualizations)

矩阵是一种常见的可视化技术,广泛应用在网络、表格、时序等数据可视化中。矩阵通过紧凑的二维网格布局形式来可视化大规模数据,网格中的每个单元表示一个数据项,通过颜色或者大小编码数据项的某个值。然而,对于多属性矩阵来说,一个数据项会包含多个值,如多个属性、多个时间值,如何有效展现这些细节面临着重大挑战。已有可视化方法通过在网格中嵌入图元的方式来展现每个数据项的细节,但是这些方法需要大量空间,难以可视化大规模矩阵。另一种方法是通过交互技术,有选择的展现一部分数据的细节信息。然而交互技术多种多样,哪些适合多属性矩阵可视化?这篇文章对于相关的交互技术进行了评估。

继续阅读 »

从计算笔记本讲述故事:人工智能辅助的用于数据科学展示的幻灯片制作 (Telling Stories from Computational Notebooks: AI-Assisted Presentation Slides Creation for Presenting Data Science Work)

数据科学项目既包括数据获取、清洗、建模等技术工作,也包括技术人员和非技术人员的高度合作。例如,数据科学家在构建模型之后,需要向项目相关者展示模型,并从他们那里收集反馈和获得支持。这一过程需要从复杂的代码中定位和提取关键信息,将这些信息组织成数据故事,同时还要根据观众背景的差异改变展示的方式。数据科学家需要耗费大量时间,且容易出错。来自香港科技大学、IBM研究院和密歇根大学的Zheng等人 [1]提出了以用户为中心、人工智能辅助的模型展示幻灯片的制作系统,帮助数据科学家提高效率。

继续阅读 »

2021年新当选院士分布可视化

11月18日,中国科学院、中国工程院2021年院士增选结果公布,共有149人当选。其中,中国科学院增选院士65人,中国工程院增选院士84人。两院院士是我国在科学技术领域设立的最高学术称号,其增选结果从侧面反映出各单位当前在顶级科研人才方面的储备情况,受到社会各界的广泛关注。

继续阅读 »