分类存档: 论文报告

以语义属性关联为指导的交互式子空间聚类分析(Interactive Subspace Cluster Analysis Guided by Semantic Attribute Associations)

在高维数据中,子空间指由维度子集构成的数据空间。为了避免数据中的重要模式被无关维度掩盖,分析人员需要选择合适的子空间作为分析对象,而不是在全维度空间进行分析。然而,子空间数量过多是子空间分析的主要挑战。包含d个维度的数据有2d-1个子空间。另一方面,虽然子空间聚类算法可以帮助我们找到包含聚类的潜在有价值子空间,但这类算法存在三个方面的问题:(1)产生的子空间数量依然过多;(2)结果存在冗余,即其中部分子空间十分相似;(3)结果存在偏差,即算法会过度强调某些维度,使它们在产生的子空间中出现的频率显著高于其他维度。面对这些问题,本文 [1]提出从语义角度生成和分析子空间的新范例(图1)。其核心思路是根据维度语义来生成子空间。

继续阅读 »

可视化历史书籍贸易数据:与领域专家密切合作的迭代设计研究(Visualizing Historical Book Trade Data: An Iterative Design Study with Close Collaboration with Domain Experts)

历史书籍的流通一直是历史学家感兴趣的领域,然而领域专家很难发现历史文献中所隐藏的地理和时间顺序特征。文章是可视化研究人员和历史学家之间的一项合作研究,作者采用九阶段框架 [2] 的变体来开发称为 DanteExploreVis 的可视化分析 (VA) 工具,帮助领域专家从多个角度探索、解释和呈现图书贸易数据。

继续阅读 »

数据播放器:根据数据与动画的关联自动化生成数据视频(Data Player: Automatic Generation of Data Videos with Narration-Animation Interplay)

将可视化与文本叙述结合能够很好地完成数据故事叙事任务。数据视频包含了丰富的数据信息,能够增强观众的参与感,并提高他们对于数据事实的理解和记忆。因而,数据视频成为了广受欢迎的数据故事叙事模式。然而,创作数据视频的门槛很高。一个高质量的数据视频要求制作者理解视频叙事方法,了解可视化设计与可视分析探索方法,并掌握视频制作技巧。这篇文章中,作者提出了一种能够自动化从静态可视化以及对应的文本叙述构建数据视频的方法框架,来降低数据视频的制作门槛。

数据视频示例
继续阅读 »

ChatKG:使用知识图谱可视化时间模式(ChatKG: Visualizing Temporal Patterns as Knowledge Graph)

当我们分析一个时间相关的数据集时,我们会首先会从原始数据中提取出特定的模式,例如波峰、波谷以及整体的趋势等,然后从这些模式中分析和发现新的知识。另外,比较不同时间数据集之间的相似模式可以发掘数据中潜在的相似性。

事实上,一个简单的时间折线图可以辅助我们完成从原始数据到简单的模式的转换。然而,这些工作没有考虑如何将这些模式进一步转换为新的知识,而后者通常对于我们理解一个数据集是十分重要的。

继续阅读 »

我为什么要读这个?解释个性化新闻推荐系统(Why am I reading this? Explaining Personalized News Recommender Systems)

互联网比以往任何时候都更容易将新闻文章分发给更多的人,人们的信息获取过程中存在大量的数据内容和数字对象溢出的问题。推荐系统(Recommender systems,缩写为RSs)变得不可或缺。然而,RSs总是缺乏透明度和多样性,用户在“被推荐什么”方面几乎没有控制权。在一个对数字信息的依赖会对我们的生活产生巨大影响的时代,这造成了人们对推荐系统的不信任感。尽管解释(explanations)、控制(control)和赋权(empowerment)等概念已在RSs领域被广泛讨论。然而,很少有人关注如何使用可视化来推进这些概念以改进现有推荐系统存在的问题。

来自瑞士的研究者提出了NewsRecXplain,其使用交互式和可解释的机器学习方法支持用户理解、诊断和改进个性化推荐系统。NewsRecXplain的界面允许用户解释和定制新闻推荐,并有助于增强用户使用推荐系统的能力,使他们发现并改善信息传播中的过滤气泡效应。

继续阅读 »

编码代码演变:了解人们如何随时间改变数据科学笔记本 (Code Code Evolution: Understanding How People Change Data Science Notebooks Over Time)

意义建构是从数据中识别、提取和解释见解的迭代过程,其中每次迭代都称为“意义建构循环”。意义构建是如何在探索和解释的过程中逐渐演变的是不清楚的,而这对于理解意义构建的过程是至关重要的。意义构建的一个典型的例子是数据科学家通过迭代代码、可视化和注释更加了解数据。数据科学家经常使用计算笔记本来达到这一目的,然后依旧存在一些问题,这些笔记本不方便跟踪笔记本在时间上的变化。

来自马里兰大学和华盛顿大学的研究者考虑如何重新设计计算笔记本,以帮助用户开展意义构建,首先要做的是探索意义构建如何在计算笔记本中演变。

继续阅读 »

众包观点:结合众包智慧和数据分析以增强因果分析(CrowdIDEA: Blending Crowd Intelligence and Data Analytics to Empower Causal Reasoning)

因果分析是人们理解与解释不同事件之间关系的过程。人们通过因果分析来解释已发生的事情,预测未来的事件,并帮助进行决策。然而事实表明,单人进行因果分析可能面临各式各样的挑战,各类无意的偏见,如确认偏差(Confirmation Bias),锚固效应(Anchoring Effect),框架效应(Framing Effect)等等,都会给结论带来偏差。另一方面,已有工作表明,虽然引入他人观点能够极大程度地帮助用户发现他们的认知盲点,但同时也会引入其他的偏差,包括从众效应(Conformity Effect),多看效应(Example Exposure Effect),逆火效应(Backfire Effect)等等。因此,研究者们需要了解当众包观点被提供给用户时,对于因果分析会产生哪些影响,以及用户会如何结合地使用数据分析技术和众包观点。

继续阅读 »

视觉说明:通过实时视觉画面增强语言交流 (Visual Captions: Augmenting Verbal Communication with On-the-fly Visuals)

在日常生活的对话中,人们会提及他人不熟悉的主题内容。在Zoom等在线会议中,即时的字幕可以帮助人们理解他人所说的话语。在这些场景下,该工作提出使用视觉图像进行辅助传达信息。具体来说,该工作设计了一个基于在线会议平台的AI辅助插件 [1],在用户的对话交流中进行多种方式的视觉图像推荐。用户可以通过Visual Caption所推荐的视觉图像进一步阐明自身的观点和内容。

继续阅读 »

空间是如何被叙述的:在文化遗址中的增强现实故事叙述中关联轨迹、叙述与作者意图(How Space is Told:Linking Trajectory, Narrative, and Intent in Augmented Reality Storytelling for Cultural Heritage Sites)

使用增强现实(AR)引导游客观览文化遗址并叙述其背后的故事是一种有效的观光导览方式(图1),其在提供路线导航功能的同时,还能提高游客游览的参与度,并强化游客对景点的映像。但在当前的增强现实地点故事叙述相关的研究中,研究者们往往将注意力放在提升游客的用户体验上,而没有给予故事创作者足够的关注,这样导致增强现实地点故事叙述的创作工具没有得到充分的发展,不利于使其发展成为一个新的创意表达媒体。在韩国KAUST的Jae-eun Shin等人的研究中[1],针对增强现实地点故事叙述的创作过程进行了用户调研,揭示创作者意图、游览轨迹的空间组织、叙述内容结构之间的联系。

继续阅读 »

CALVI: 可视化中读写能力的批判性思维评估(CALVI: Critical Thinking Assessment for Literacy in Visualizations)

虽然可视化可以有效地传递信息,但有时它们也会向读者传达有误导性的信息。这种情况被称为可视化误导(visualization misinformation)。面对误导,一个有趣的问题是:公众能在多大程度上识别可视化的错误信息?要回答它,我们首先需要有一种指标来衡量公众相应的阅读、解释和推理错误的或有潜在误导性的可视化信息的能力。本文 [1]提出CALVI,一个用以衡量可视化读写能力批判性思维方面的系统性测试(图1)。CALVI包含45个项目,这些项目来自错误信息类型和图表类型的设计空间。每个单元格都是一个可视化的多选题。

继续阅读 »