月度存档: 四月 2022

定量和定类高维数据的对偶分析(Integrated Dual Analysis of Quantitative and Qualitative High-Dimensional Data)

对偶空间分析(dual space analysis)是一种先进的高维数据分析方法。它包含维度空间和数据项空间,用户在一个空间上的操作会反映在另一个空间上,从而使得用户可以同时探索它们,联合地研究维度空间的结构和数据项空间的分布(图1)。然而,以往的工作没有平等地处理定量维度和定类维度,后者通常只用来定义数据项子集。这可能会导致有趣的模式被忽略。面对这一局限,作者提出两个能够同时描述定量和定类数据的统计度量来扩展当前对偶空间分析的框架,并开发了一个原型系统来帮助用户完成联合的探索性分析 [1]。

继续阅读 »

拟人化图元对分类任务准确性的影响(Effect of Anthropomorphic Glyph Design on the Accuracy of Categorization Tasks)

数据图元(glyph)在信息可视化等领域得到了广泛应用,然而图元在分类任务上的认知和感知理论研究较少。本文作者对拟人化的图元进行实验,探究其对分类任务准确性的影响[1]。作者假设拟人图元对分类任务的准确性有正面提升,然而实验结果说明非拟人的图元效果更好。

继续阅读 »

Neo: 一种支持层次结构标签和多输出标签的混淆矩阵可视化 (Neo: Generalizing Confusion Matrix Visualization to Hierarchical and Multi-Output Labels)

混淆矩阵是一种常见的可视化形式,它通过一个表格式的布局,对所有数据预测的标签与的实际标签进行比较,用于帮助人们评估机器学习模型。来自苹果公司的研究人员对机器学习领域学者进行调研,发现一般的混淆矩阵无法处理层次结构标签和多输出标签,因此他们设计了一个混淆矩阵代数,并提出了Neo[1],一种新型的支持层次结构标签和多输出标签的混淆矩阵可视化系统,允许从业者灵活地编写、互动和分享混淆矩阵。

继续阅读 »

结构感知的可视化检索(Structure-Aware Visualization Retrieval)

随着可视化技术普及,大量可视化被创建并在网上分享。如何检索可视化成为重要的问题。基于样例检索相似的可视化信息是创建集合和可视化推荐的基础。传统的可视化检索通常只考虑了视觉信息[1],却忽略了可视化中存在的视觉元素之间的结构。考虑可视化的结构信息,来自香港科技大学和新加坡管理大学的Haotian Li等人 [2] 提出了一种融合可视化的视觉信息和结构信息的检索方法。

继续阅读 »

多属性矩阵可视化的交互技术评估 (The Pattern is in the Details: An Evaluation of Interaction Techniques for Locating, Searching, and Contextualizing Details in Multivariate Matrix Visualizations)

矩阵是一种常见的可视化技术,广泛应用在网络、表格、时序等数据可视化中。矩阵通过紧凑的二维网格布局形式来可视化大规模数据,网格中的每个单元表示一个数据项,通过颜色或者大小编码数据项的某个值。然而,对于多属性矩阵来说,一个数据项会包含多个值,如多个属性、多个时间值,如何有效展现这些细节面临着重大挑战。已有可视化方法通过在网格中嵌入图元的方式来展现每个数据项的细节,但是这些方法需要大量空间,难以可视化大规模矩阵。另一种方法是通过交互技术,有选择的展现一部分数据的细节信息。然而交互技术多种多样,哪些适合多属性矩阵可视化?这篇文章对于相关的交互技术进行了评估。

继续阅读 »

Cicero:响应式可视化的声明式语法 (Cicero: A Declarative Grammar for Responsive Visualization)

设计响应式可视化可以看作是对源可视化进行转换以使其适合不同的屏幕尺寸,然而,这一过程往往是繁琐的。论文的作者提出了声明式语法Cicero,用于简明地指定响应式可视化的转换,为更智能的响应式可视化创作工具铺平道路。

继续阅读 »

从计算笔记本讲述故事:人工智能辅助的用于数据科学展示的幻灯片制作 (Telling Stories from Computational Notebooks: AI-Assisted Presentation Slides Creation for Presenting Data Science Work)

数据科学项目既包括数据获取、清洗、建模等技术工作,也包括技术人员和非技术人员的高度合作。例如,数据科学家在构建模型之后,需要向项目相关者展示模型,并从他们那里收集反馈和获得支持。这一过程需要从复杂的代码中定位和提取关键信息,将这些信息组织成数据故事,同时还要根据观众背景的差异改变展示的方式。数据科学家需要耗费大量时间,且容易出错。来自香港科技大学、IBM研究院和密歇根大学的Zheng等人 [1]提出了以用户为中心、人工智能辅助的模型展示幻灯片的制作系统,帮助数据科学家提高效率。

继续阅读 »