TACO:可视化表格数据的变化(TACO: Visualizing Changes in Tables Over Time)

多变量的表格数据是我们的日常生活中是最为常见的一种数据。对于多个表格数据,他们会在结构和内容方面发生变化,进而产生不同的版本。然而理解表格数据以及探索多变量表格数据的一个重要的任务是对于表格数据进行比较,本文所针对的表格数据的变化包括表格数据的删除,增加,重排序,合并/分离以及表格内容改变等。本文所提出的工具TACO[1],针对表格数据的不同变化设计了新颖的可视化形式,同时根据自顶向下的探索分析方法帮助用户对于大量的表格数据进行探索。

理解表格数据在很多不同的领域是非常重要的一个方面,理解表格数据的一个非常重要的方面是对于表格数据进行比较,比如说对于多个生物医学的实验数据,对于表格数据的变化的探索存在很多种不同的变化, 主要包括结构上的变化,内容上的变化,重排序以及合并/分离不同的行/列。本文主要提出的方法针对的是支持用户探索得到表格数据的各种变化,TACO作为一个交互探索比较多个表格数据的工具,可以支持用户在多个层级上进行比较。首先TACO成对的计算表格数据之间的区别,对于表格数据的区别进行编码,进而支持用户的探索。

表格数据是由行和列共同组成,行与列的交汇位置处是表格内的具体元素。在表格内,每一行和每一列都可以被一个key(关键词)唯一的进行标志,每一个元素可以被一对行和列的关键词唯一的进行确定。相对于矩阵数据,表格数据中的行与列的顺序是非常重要的一个属性,在表格数据的比较中,比较行与列的顺序也是非常重要的一个方面。除此之外,相对于矩阵数据,表格数据不仅仅可以包含数值类型的数据,同时包含着非数值类型的数据,包含有非数值类型的数据的表格被称为异构型表格,全部为数值类型数据的的被称为同构型表格。

基于上述的四类表格数据变化的形式,本文抽象出了四个用户任务,即为:

  1. 用户需要识别出表格数据变换的类型
  2. 比较表格数据随着时间的变化。
  3. 比较一个表格数据在两个时间点的变化。
  4. 展示原始数据以及表格的元数据

基于本文所针对的四个用户任务,本文所开发的系统TACO设计了四种不同的可视化方式描述四种不同的变化,如下图所示,

TACO所针对的四种变化形式包括:增加/减少,合并/分离, 变换顺序,内容变化

因为本文所针对的场景是多个表格数据的比较,为了支持这一任务,TACO支持从全局概览到感兴趣的局部细节的多层级的用户探索。用户在TACO上的探索开始于聚合的,以时间为导向的全局概览视图,在全局概览视图中,使用堆叠式的柱状图标志不同类型的数据所占比例,在该视图中,用户可以选择任意两个感兴趣的表格数据,用户所选择的表格数据将提供横向的行的聚合,纵向的列的聚合得到比较的结果,横向与纵向的合并结果可以反映在diff的矩阵数据中,支持用户得到不同类型的数据在行和列中所占的比例。进一步地,用户可以展示详细的表格数据,表格数据使用热力图的方式进行表示,对于原始的表格数据,TACO使用颜色的灰度表示每个单元格中的数值大小,所选择的两个表格数据比较可以得到比较结果的表格数据,表格数据中的颜色所反映的是数据的比较状态,其中绿色表格增加,红色表格减少,为了保证该系统适用于普适的用户,本文所采用的颜色是对于红绿色盲友好的颜色。

TACO所采用的自顶向下的分析探索流程

经过上述的映射,不同的变化可以可视化为一下的形式:

针对上述四种表格数据的变化,本文分别设计了对应的可视化形式。可视化形式的组合可以帮助用户理解表格数据的变换

本文将TACO多表格数据比较的可视化系统应用在奥林匹克运动化的奖牌数据表格分析以及癌症基因的表格数据分析中,通过TACO系统可以有效的帮助用户发现系统中所存在的信息,比如说用户发现了经过第二次世界大战,德国和日本的奖牌数量的迅速变化,如下图所示:

TACO系统分析各个国家的奥运奖牌数随时间的变化

本文所设计完成的TACO可视化系统支持用户对于多个数值类型的表格数据进行比较,主要支持用户探索发现四个方面的变化,1.数据变化;2. 结构变化; 3. 重新排序;4. 合并和分离,并且TACO支持应用对于四中不同的变化采用不同方式进行可视化。为了支持多个表格数据比较的任务,TACO支持自顶向下,即从全局概览到局部细节的分析,帮助用户探索得到数据的细节,TACO系统可以有效的应用在比较多表格数据的任务中,应用TACO系统在奥林匹克奖牌数据以及癌症基因数据中,能够有效的帮助用户对于多变量表格数据的比较探索。

[1]Christina Niederer, Holger Stitz, Reem Hourieh, Florian Grassinger, Wolfgang Aigner, and Marc Streit. TACO: Visualizing Changes in Tables Over Time. IEEE Transactions on Visualization and Computer Graphics, 24(1):677 – 686, 2018.

评论关闭。