CrossData: 利用文字和数据之间的关联(CrossData: Leveraging Text-Data Connections for Authoring Data Documents)

研究者常用数据文档来记录在进行数据探索中的各种发现。尽管目前已经有相当多的工具可以被用于进行数据探索,但是针对帮助进行数据文档编写的工具仍然很少。研究者们仍然需要通过手动的方式记录和维护数据文档。于此同时,一旦数据本身发生更新,对应的数据文档就需要进行修改;由于缺少对应的工具,手动地对数据文档进行修改和维护始终是一件乏味且容易出错的事。为了解决这个问题,来自加州大学圣地亚哥分校的研究者们提出了CrossData,通过自动识别数据和文本之间的关系,来帮助对数据文档的编写。

继续阅读 »

多视图可视化设计的引导式语义捕捉(Semantic Snapping for Guided Multi-View Visualization Design)

图1:Semantic snapping 引导用户交互修改多视图可视化设计

视觉信息显示通常由多个可视化组成,用于促进对数据的理解。然而,由于缺乏可视化的专业设计知识,非专家用户在设计多视图可视化时,可能会造成误导或其他有问题的结果。例如,违反一致性约束,即相同的数据应该以相同的方式显示,不同的数据应该以不同的方式显示。然而,让用户手动检测和解决冲突很容易出错,尤其是对于初学者来说,要想出替代的表示会十分耗时。因此,一种自动或半自动的方法有望帮助用户检测和解决潜在问题。在检查视图之间的关系,确定潜在的改进方案,以及实现相应变化等方面仍然存在挑战。传统的Snapping会在几何图像周围创建一个“重力场”,从而更容易将它们以特定方式放在一起。在本文中,Semantic Snapping 表示在将多个单独的视图融合在一起时,解决相互的冲突和冗余。

继续阅读 »

你明白你的意思吗?使用预测可视化降低对时间估计的乐观性(Do You See What You Mean? Using Predictive Visualizations to Reduce Optimism in Duration Estimates )

在日常生活中,人们在对某项任务的用时进行预估时,往往会给出一个乐观的、低于实际的估计,甚至在拥有相关的经验时也是如此。这种现象在心理学上被称为规划谬误(Planning Fallacy)。本文提出了一种混合的方法,通过结合已有的去除预估偏差的方法和适合的可视化工具,以帮助人们减轻规划谬误,给出更准确的时间预估。

图一 分位数点图:反映了任务时长的概率分布
继续阅读 »

2022年第十三期北京大学可视化发展前沿研究生暑期学校开放报名

  第十三期2022年北京大学可视化发展前沿研究生暑期学校将于7月12-20日以在线授课方式举行。暑期邀请了海内外在可视化研究领域具有深厚造诣的知名学者,面向学员系统探讨本领域的前沿理论和研究方法。本次课程主要关注可视化在交叉领域的应用和发展,特别是在人文、社科、技术等方面的结合。欢迎可视化相关专业、设计专业和应用领域学生学者报名参加。
   提交申请材料页面:http://www.chinavis.org/s22/register/index.html

课程简介
  可视化暑期学校邀请海内外在可视化研究领域具有深厚造诣的知名学者,面向学员系统探讨本领域的前沿理论和研究方法。本次课程主要关注可视化在交叉领域的应用和发展。
  2022年7月12日-14日为基础知识课程,该部分主要讲授可视化技术(结合北京大学在线可视化慕课内容)与相关信息设计基础知识。2022年7月15日-19日为前沿课程。7月20日为课程总结。
   课程网站:http://chinavis.org/s22/

继续阅读 »

可计算的可视化:可视化处理和分析的形式化数学运算符(ComputableViz: Mathematical Operators as a Formalism for Visualization Processing and Analysis)

随着可视化创作工具的可用性和大众化程度的提高,大量的可视化已经产生并在网络上共享。在可视化生成和数字化之后,探索用于处理和分析可视化的技术的研究兴趣日益浓厚。例如,研究人员已经开始研究可视化上的风格迁移和基于示例的检索的问题。在这种趋势下,新的想法和问题不断涌现,因此有必要提炼出这些研究工作的整体框架,以便于未来工作的开展。在此背景下,来自香港科技大学等三所学校的伍翱宇等研究者提出可计算的可视化[1],为可视化的处理和分析提供一个基于数学运算符的统一框架。

继续阅读 »

定量和定类高维数据的对偶分析(Integrated Dual Analysis of Quantitative and Qualitative High-Dimensional Data)

对偶空间分析(dual space analysis)是一种先进的高维数据分析方法。它包含维度空间和数据项空间,用户在一个空间上的操作会反映在另一个空间上,从而使得用户可以同时探索它们,联合地研究维度空间的结构和数据项空间的分布(图1)。然而,以往的工作没有平等地处理定量维度和定类维度,后者通常只用来定义数据项子集。这可能会导致有趣的模式被忽略。面对这一局限,作者提出两个能够同时描述定量和定类数据的统计度量来扩展当前对偶空间分析的框架,并开发了一个原型系统来帮助用户完成联合的探索性分析 [1]。

继续阅读 »

拟人化图元对分类任务准确性的影响(Effect of Anthropomorphic Glyph Design on the Accuracy of Categorization Tasks)

数据图元(glyph)在信息可视化等领域得到了广泛应用,然而图元在分类任务上的认知和感知理论研究较少。本文作者对拟人化的图元进行实验,探究其对分类任务准确性的影响[1]。作者假设拟人图元对分类任务的准确性有正面提升,然而实验结果说明非拟人的图元效果更好。

继续阅读 »

Neo: 一种支持层次结构标签和多输出标签的混淆矩阵可视化 (Neo: Generalizing Confusion Matrix Visualization to Hierarchical and Multi-Output Labels)

混淆矩阵是一种常见的可视化形式,它通过一个表格式的布局,对所有数据预测的标签与的实际标签进行比较,用于帮助人们评估机器学习模型。来自苹果公司的研究人员对机器学习领域学者进行调研,发现一般的混淆矩阵无法处理层次结构标签和多输出标签,因此他们设计了一个混淆矩阵代数,并提出了Neo[1],一种新型的支持层次结构标签和多输出标签的混淆矩阵可视化系统,允许从业者灵活地编写、互动和分享混淆矩阵。

继续阅读 »

结构感知的可视化检索(Structure-Aware Visualization Retrieval)

随着可视化技术普及,大量可视化被创建并在网上分享。如何检索可视化成为重要的问题。基于样例检索相似的可视化信息是创建集合和可视化推荐的基础。传统的可视化检索通常只考虑了视觉信息[1],却忽略了可视化中存在的视觉元素之间的结构。考虑可视化的结构信息,来自香港科技大学和新加坡管理大学的Haotian Li等人 [2] 提出了一种融合可视化的视觉信息和结构信息的检索方法。

继续阅读 »

多属性矩阵可视化的交互技术评估 (The Pattern is in the Details: An Evaluation of Interaction Techniques for Locating, Searching, and Contextualizing Details in Multivariate Matrix Visualizations)

矩阵是一种常见的可视化技术,广泛应用在网络、表格、时序等数据可视化中。矩阵通过紧凑的二维网格布局形式来可视化大规模数据,网格中的每个单元表示一个数据项,通过颜色或者大小编码数据项的某个值。然而,对于多属性矩阵来说,一个数据项会包含多个值,如多个属性、多个时间值,如何有效展现这些细节面临着重大挑战。已有可视化方法通过在网格中嵌入图元的方式来展现每个数据项的细节,但是这些方法需要大量空间,难以可视化大规模矩阵。另一种方法是通过交互技术,有选择的展现一部分数据的细节信息。然而交互技术多种多样,哪些适合多属性矩阵可视化?这篇文章对于相关的交互技术进行了评估。

继续阅读 »