异构多维数据现在已经足够普遍,甚至可以被称为无处不在。目前最常见的可视化这些数据的方法就是提出新的可视化来表示这些数据。这些新的解决方案具有很强的创造性,但对于用户往往比较陌生。本文[1]探索扩展常见和熟悉的可视化,通过嵌入异构数据属性(HEDA),使熟悉的可视化能够显示更多信息。展示了如何开发一个通用的、交互式的可视化组件,可以对常见的可视化技术进行拓展的同时,尊重结构的熟悉布局。开发一个表格的可视化构建块,使个人通过对嵌入式多变量数据的操作,直观地观察、探索和查询其熟悉的可视化。本文通过探索在 D3 Gallery 里熟悉的可视化中应用 HEDA 来测试其应用空间,并能够基于属性的重新排序来实现数据查询。
图1所展示的就是一个车辆数据,这是一个典型的异构多维数据。我们可以看到数据有许多维度,这些维度分别属于不同的属性类别(有序、定量、分类)。如何使用简单的可视化方法清晰的展示这么多维度,这成为了一个不小的挑战。
图1 汽车数据示例
本工作提出的方法是在我们熟悉的可视化基础上加上自定义的拓展,组成了嵌入异构数据属性(HEDA),如图2所示。
图2 HEDA 将常见可视化与自定义相结合
我们描述和定义了交互式表格形式的可视化组件,可以扩大共同的可视化技术来表示多维多类数据的细节。我们还详细描述了 HEDA 如何对可视化技术进行拓展,并解释了它如何用于可视化数据查询。
HEDA 矩阵是一个可视化组件,可以集成嵌入其他可视化。我们通过展示和推广这个基本的想法是一个强大的模块化组件,可以以各种不同的方式成功地与现有的可视化集成。图3显示了五个属性在一个大的行。每行代表一个属性,每个列持有一个数据实体的属性。在图3中,分类属性是绿色的,定量的是灰色的。行和列都能重新排序,让方向选择基于初步可视化。属性可以是任何数据类型:二进制,标称,序数和定量。
- 定量:对于定量属性,我们使用一个条柱相对该属性的最小值和最大值大小来表示。选择包括使用位置(或)值。
- 序数:我们使用给定的顺序的名义属性来分配条柱大小。
- 名词:它们可以表示使用图标(或)颜色。也有可能根据任意外部分配一个名义属性的排序排序,以便自动表示它与所使用的技术定量或有序数据。因此,有一个所有属性的一致编码,我们可以任意选择分配外部排序名义属性,和使用表示数据值的条形图的大小。
- 二进制:二进制数据可以是序数或标称。对于序数数据,我们使用给定的顺序和标称数据,我们只是显示一个值与半条柱和其他价值与完整的条柱,或一具有空单元格的值和填充单元格的值。
图3 含有5个属性的HEDA
我们已经描述了HEDA背后的基本观念,一个模块化的表达它持有所有数据集的所有属性的可视化表示.
实体可以嵌入在熟悉的可视化。接下来,我们解释如何可以做到这一点。第一个解释我们使用弧图。
弧图是一种常用的节点连接图。实体之间的关系,如在网络。实体(节点)沿一条直线定位。显示的关系
作为链接,绘制的节点之间的曲线弧的形式。自这些弧可以绘制在一个或另一侧的节点,它是通过使用两边来显示两种类型的关系节点。图4显示了HEDA可以嵌入到弧图用于表示额外的数据属性,如所有附加数据属性是一个统一的方式来表示,原来的视觉布局结构得到了保存。在图4中,除了属性行标记主要的可视化,HEDA要显示或隐藏的需求和查询面板支持用于排序和能力的属性选择和建立排序的优先级降属性。
这个数据集表示了律师所在公司和他们的关系。所示的属性是:年龄,地位,性别,办公室,工龄,实践,和法学院。如查询小组的查询显示,律师按年龄顺序排列.。
图4 Arc Diagram-HEDA
每一个实体在一个散点图表示可以有多个属性。然而,一个基本的散点图只显示了两个定量属性的数据集,使用垂直和水平轴。一些额外的数据尺寸的增加可以用直观的视觉变量显示方法,如颜色和大小。然而,这些附加维度是有限的,因为每个合适的视觉变量可以仅用于增加布局的一次。
散点图可视化的汽车数据集。HEDA已被应用作为x和y轴的延伸。
选择:选择是一种相互作用,支持过滤一组数据实体,并能够按照选定的实体而交互操作的轴和重新排序和达。套索选择一组数据实体使选中的实体和它们的表示在HEDA消失。
图5 Scatter Plot-HEDA
由于坐标轴散点图的定量性质,一些点可能空间位置接近。然而,在HEDA中,每个实体都有一个分配的非重叠的空间。因此,和表示的某些实体的属性不直接与相应的内联点。显示分析师实体之间的相关性及其相应的技术属性,每个轴根据数据的细分是必要的。使用连接线,每个轴的实体在和其相应的字区域内(图5)。
图6 scatter plot-HEDA的对齐问题
我们已经描述了如何开发可以嵌入到一个弧图和一个散点图。而新的和增强的数据查询潜能,嵌入的过程各不相同。开发一个多功能的概念,可以应用到众多的可视化。然而,不同可视化的应用存在变化。接下来,我们探索HEDA的设计空间,讨论HEDA如何可以应用到D3 Gallery中的著名的可视化。
图7 将HEDA应用到D3库中
我们第一组可视化分为两类,根据是否通过重新排序的开发熟悉的可视化或转换可视化表示结构。我们称这些顶级类别重新排序的转变。在这两个顶级类别,可视化可以根据是否改变再次分组全局或局部方面的可视化结构。请注意,几个可视化可以容纳超过一类取决于他们所代表的数据。
图8 HEDA 的分类
如果HEDA重新排序时能够尊重并保持原来的可视化布局,则称这类为 reorderable。一些可视化是完全reordeable 和一些局部 reordeable。
可视化是完全重新排序,如果表示实体的可视化可以重新使用和无干扰原始布局的可视化。完全重新排序的可视化开发区作为一个单元,多个单元,或作为一个环。
图9 完全可重排
如果有可能重新排序子集的可视化是局部重排所代表的实体和不使用可视化扰乱原有布局的可视化,则称为局部可重排。
HEDA的重排如果会导致原有可视化布局的变化,则称为transformable。
如果HEDA重新排序一个可视化完全转化均为代表的数据实体。虽然它仍然可以被嵌入进入可视化,它的重排会导致整个可视化结构的变化,则称为全局的Transformable。
例如使用HEDA扩展的折线图。原折线图按照日期温度升序显示(顶部),依据天气重新排序,然后在每个天气类别的数据点在本地重新排序降序日期(下部)。
图10 按照天气重新对折线图进行排序
图11 Parallel Coordinates 和 Star Plot 均为全局可重排
如果HEDA不能重排来表示可视化数据实体,则称为局部的 transformable 。但它仍然可以被嵌入到代表性目的的可视化。Minard的地图显示了流动的拿破仑进军俄罗斯地图。在这个著名的可视化,在地图底部的水平线显示从地图的几个地方的温度。温度是一个额外的数据属性,已被集成到主布局,可以辅助分析人员对形状和推理地图上的流量宽度。以同样的方式,它是可能嵌入赫达在米纳德地图直观地表示额外的数据尺寸采样空间位置。
图12 拿破仑行军图 – HEDA
本文提出了异构嵌入式数据属性(HEDA)作为一个通用的交互式可视化组件,可以嵌入到一个主要的和熟悉的视觉表示,以创建一个混合可视化。提供了可视的多维度、多类型的数据实体,同时尊重初级可视化的结构。HEDA 是一个互动的表格状的数据的表示,采用矩阵排序技术来分析探索数据,并在主上下文中生成视觉查询布局。除了异构多维数据的可视化表示,HEDA 的优点还包括:
- 保持熟悉可视化的主要布局;
- 根据需要访问 HEDA 的详细数据;
- 可视化数据在一个整体的视图;
- 利用矩阵排序查询进行交互;
- 比较每个实体的属性数据值。
总的来说,本文提出了HEDA,一种交互表可视化组件,可以嵌入到熟悉的可视化技术。提供了基于数据异构的交互式查询多维属性的拓展功能,同时尊重结构原来熟悉的布局。
参考文献
[1]Loorak M H, Perin C, Collins C, et al. Exploring the Possibilities of Embedding Heterogeneous Data Attributes in Familiar Visualizations[J]. IEEE Transactions on Visualization & Computer Graphics, 2017 (1): 581-590.
评论关闭。