分类存档: 研究

智能与考古跨学科合作分析彩陶花纹演变

北京大学智能学院袁晓如课题组和考古文博学院张海课题组合作取得重要跨学科研究进展,研发帮助考古学家追踪和分析彩陶花纹演变的可视分析系统。工作近日被可视化领域国际会议IEEE PacificVis 2024期刊轨征文接收,论文将直接发表于可视化领域旗舰期刊 IEEE TVCG(CCF A类)。

继续阅读 »

以语义属性关联为指导的交互式子空间聚类分析(Interactive Subspace Cluster Analysis Guided by Semantic Attribute Associations)

在高维数据中,子空间指由维度子集构成的数据空间。为了避免数据中的重要模式被无关维度掩盖,分析人员需要选择合适的子空间作为分析对象,而不是在全维度空间进行分析。然而,子空间数量过多是子空间分析的主要挑战。包含d个维度的数据有2d-1个子空间。另一方面,虽然子空间聚类算法可以帮助我们找到包含聚类的潜在有价值子空间,但这类算法存在三个方面的问题:(1)产生的子空间数量依然过多;(2)结果存在冗余,即其中部分子空间十分相似;(3)结果存在偏差,即算法会过度强调某些维度,使它们在产生的子空间中出现的频率显著高于其他维度。面对这些问题,本文 [1]提出从语义角度生成和分析子空间的新范例(图1)。其核心思路是根据维度语义来生成子空间。

继续阅读 »

可视化历史研究取得重要进展-各国历史早期可视化数据集将在IEEE VIS 2023发布

近日,来自牛津大学的研究者和北京大学智能学院袁晓如课题组紧密合作,汇同香港科技大学、复旦大学和华为等机构研究者,对各国历史早期创建的可视化进行了系统收集,构建相应数据集。研究工作取得重要进展,相关论文被可视化领域旗舰国际会议 IEEE VIS 2023接收。该工作系统构建了一个各国历史早期可视化数据集,涵盖各国早期超过13000余件可视化工作,为未来可视化和人文领域的相关研究提供了基础。

继续阅读 »

智能与人文跨学科合作探索汉籍流传图谱

近日,北京大学智能学院袁晓如课题组和中文系杨海峥课题组取得重要跨学科合作研究进展,针对中国古籍在日本流传时空路径分析的研究工作被可视化领域旗舰国际会议 IEEE VIS 正式接收。

书籍是文化的载体,书籍的传播即文化的延伸。中国的古籍很早就流传到朝鲜、日本以及欧美,外国人通过中国的书籍来认识、理解、诠释和研究中国文明,书籍的流传是中国文化在异域文化背景下的自然延伸。“汉籍”一词来自日本,是指中国人用汉字书写的书籍。汉籍作为中外交流的重要内容,不仅承载和弘扬了中国文化,也见证了全球文化的交融。在汉籍流布史上,中日间交流历史悠久,影响也最为深远。汉籍传入日本并在日本传播和被接受,其中许多细节已不可考,但借助现存古籍中的序跋、牌记、藏书印等信息,仍可推测其流传与递藏的轨迹。如图 1,经由详细考证,可以部分推测南宋刊本《东坡集》的海外流布时间线与流传轨迹。

继续阅读 »

我为什么要读这个?解释个性化新闻推荐系统(Why am I reading this? Explaining Personalized News Recommender Systems)

互联网比以往任何时候都更容易将新闻文章分发给更多的人,人们的信息获取过程中存在大量的数据内容和数字对象溢出的问题。推荐系统(Recommender systems,缩写为RSs)变得不可或缺。然而,RSs总是缺乏透明度和多样性,用户在“被推荐什么”方面几乎没有控制权。在一个对数字信息的依赖会对我们的生活产生巨大影响的时代,这造成了人们对推荐系统的不信任感。尽管解释(explanations)、控制(control)和赋权(empowerment)等概念已在RSs领域被广泛讨论。然而,很少有人关注如何使用可视化来推进这些概念以改进现有推荐系统存在的问题。

来自瑞士的研究者提出了NewsRecXplain,其使用交互式和可解释的机器学习方法支持用户理解、诊断和改进个性化推荐系统。NewsRecXplain的界面允许用户解释和定制新闻推荐,并有助于增强用户使用推荐系统的能力,使他们发现并改善信息传播中的过滤气泡效应。

继续阅读 »

编码代码演变:了解人们如何随时间改变数据科学笔记本 (Code Code Evolution: Understanding How People Change Data Science Notebooks Over Time)

意义建构是从数据中识别、提取和解释见解的迭代过程,其中每次迭代都称为“意义建构循环”。意义构建是如何在探索和解释的过程中逐渐演变的是不清楚的,而这对于理解意义构建的过程是至关重要的。意义构建的一个典型的例子是数据科学家通过迭代代码、可视化和注释更加了解数据。数据科学家经常使用计算笔记本来达到这一目的,然后依旧存在一些问题,这些笔记本不方便跟踪笔记本在时间上的变化。

来自马里兰大学和华盛顿大学的研究者考虑如何重新设计计算笔记本,以帮助用户开展意义构建,首先要做的是探索意义构建如何在计算笔记本中演变。

继续阅读 »

DeHumor: 分解幽默的可视分析系统(DeHumor: Visual Analytics for Decomposing Humor)

尽管幽默是一项重要的沟通技巧,但理解幽默往往充满挑战——成功地运用幽默需要结合引人入胜的内容构建和适当的口头表达方式(比如停顿)。先前的工作强调笑点(punchline)的文本和音频特征,但忽略了在更长的上下文中对笑点的铺垫(build-ups)。此外,这些理论通常过于抽象,无法理解每个具体的幽默片段。

在这篇研究中,作者开发了 DeHumor,一个用于分析公开演讲中幽默行为的可视化分析系统。

继续阅读 »

图表阅读器:为屏幕阅读器用户设计的无障碍可视化体验(Chart Reader: Accessible Visualization Experiences Designed with Screen Reader Users)

数据可视化使人们能够有效地探索数据并有效地交流见解。但可视化依赖视觉能力,而盲人或低视力人士有视觉缺陷。盲人或低视力人士主要使用屏幕阅读器辅助阅读,可它与大部分可视化不兼容。已有工作尝试从多方面弥补屏幕阅读器的不足,包括提供文本或表格、通过键盘等交互,但缺少系统性研究,没有可用性。

来自微软和美国华盛顿大学的研究者将已有的工作综合在一起,提供一个可访问引擎,了解如何平衡功能与可用的屏幕阅读器用户的可视化设计,同时探索设计空间。

继续阅读 »

MosaicSets:网格图上的集合可视化(MosaicSets: Embedding Set Systems into Grid Graphs)

集合可视化是信息可视化的一个重要研究领域。对于抽象集合系统的可视化,一种常用的方法是欧拉图,但是它通常侧重于集合关系而不关注其中的单个元素。来自德国波恩大学和维也纳技术大学的研究人员提出了MosaicSets [1],一种将给定的集合系统嵌入到规定的网格图中的可视化方法。如图1所示,该可视化包括基本地图(Base map)和覆盖(Overlay)两部分组成,基本地图中的相同颜色的节点属于同一个集合,覆盖中由一种颜色的边框包围的节点属于同一个集合。

继续阅读 »

CohortVA:基于历史数据的群体交互探索可视化分析系统(CohortVA: A Visual Analytic System for Interactive Exploration of Cohorts based on Historical Data)

在历史研究中,群体是指从事共同活动或频繁互动的一群人物,历史学家通过研究历史人物的行为来探讨社会结构的变化和社会流动的趋势。传统的历史群体分析耗费大量的精力和时间,而现有的自动数据挖掘方法则缺乏有效的视觉解释。对此,来自浙江大学的Wei Zhang等人[1]通过与历史学家合作,提出了一种交互式的可视分析方法——CohortVA,使得历史学家能够将专业知识和洞察纳入迭代探索群体的过程中,极大地提高群体识别、人物筛选和假设验证的能力。该论文发表于VIS 2022。

继续阅读 »