聚合集: 基于元素聚合的可拓展的集合探索 (AggreSet: Rich and Scalable Set Exploration using Visualizations of Element Aggregations)

集合数据是一种常见的数据,它以集合中元素作为属性。除了集合属性(set-typed attribute)之外,也可能存在着其他常规的属性。在集合数据中探索集合关系是此类数据的一个重要分析问题。但当集合数量变多、集合中元素增多,如何有效地探索这些集合关联是一个挑战。针对现有方法存在可拓展性不好,或针对特定的任务而设计,抑或将常规属性与集合属性区分,设计并不统一等问题,这篇论文设计了统一的、可拓展的集合探索可视化形式——AggreSet[1].

此前,存在着许多关于集合数据的可视化工作。Alsallakh等人[2]对集合数据与集合数据的可视化进行了综述。在我们组之前的一篇博文中有所介绍。在此不复赘述了。图一所示了相关集合可视化方法,视觉遮挡限制了这些方法应用到大规模的集合数据中。

relatedwork

图一 相关集合可视化方法

采用聚集的方法应对数据规模的问题的思路,近几年也被应用到集合可视化中。例如Radial Sets[2],它通过将物体按照不同的集合进行聚集,并使用圆形布局,而后用圆弧间弦来表示集合间的交关系(参见博文)。本文也采用了聚集的思想。但Radial Sets的方法将集合属性与常规属性区分开来。与其不同,本文对元素、元素集合以及其他属性设计了统一的探索交互。下图二所示了其探索模型。针对个体的元素、元素的聚集(包括集合序列、集合度以及集合相交)、以及其他常规属性,提供了查找、选择、过滤等操作,而任意的操作结果会在其他对象上进行同步。

model_aggreset图二 探索模型

基于这个探索模型,论文作者设计了如下图三所示的探索界面。使用矩阵(图三左)来表示集合相交情况,格点中圆大小表示集合相交程度。集合序列(图三中)使用横向柱形图表示,集合度(图三右)使用柱形图来表示。其他属性也是用柱形图表示。为了应对潜在的大规模挑战,矩形是可缩放、可滚动的。通过连续的交互定位到特定的集合上,来进行相交情况的观察。同时,由于采用了聚集,当规模变大时,并不会对柱形图有很大的影响。

interface_aggreset

图三 界面设计

矩阵可视化集合相交,横向柱形图表示集合列表,柱形图表示集合度分布

在交互上,为了保证统一的交互设计,包括了在每个视口里,可以通过鼠标悬浮来预览在其他窗口中的分布比例。这部分使用橙色高亮出来(图四)。此外,用户可以通过在集合度以及其他属性上设置相关的限定条件来过滤满足一定条件的物体,其他窗口中的数据会被动态更新,而未被选中的数据以灰色背景显示。为了方便对比,用户可以通过点击柱形图边上的锁来锁定一个对照对象,而此时悬浮在其他集合上的情况将会被高亮出来进行对比。

图四为AggreSet应用于电影数据中。每部电影的类型属性是一个集合属性,可能集合中的多种元素。通过集合度的分布可以得到,有大于2000部的电影的类型包括了2种类型。此时,我们锁定了浪漫类型的电影(图四中黑色部分),而高亮了动作类型的电影(图四种橙色部分)。通过电影列表可以看到,在按照rating排序的前几名中,是由“godfather”是被高亮,即其属于动作类型。而在刺激类型的电影中,同时属于动作类型的电影有133部,而属于浪漫类型的电影则很少。通过矩阵可以观察到,同时具有科幻、刺激类型的电影中,超过50%都是动作片,而浪漫片却所占比例不高。同时,在儿童片中,动作类型的要明显小于刺激类型的。而儿童片中,没有又是犯罪类型的篇子。

Aggreset

图四 电影数据应用

本文提供了在线工具,提供了适用的数据集,同时也支持用户上载数据进行探索。

 

参考文献

[1] M. Adil Yalçın, Niklas Elmqvist, and Benjamin B. Bederson. AggreSet: Rich and Scalable Set Exploration using Visualizations of Element Aggregations. Visualization and Computer Graphics, IEEE Transactions on 22.1 (2016): 688-697.

[2] B. Alsallakh, L. Micallef, W. Aigner, H. Hauser, S. Miksch, and P. Rodgers, “Visualizing Sets and Set-typed Data: State-of-the-Art and Future Challenges,” presented at the Eurographics Conference on Visualization (EuroVis), Swansea, Wales, UK, 2014, pp. 1–21.

[3] Bilal Alsallakh, Wolfgang Aigner, Silvia Miksch, Helwig Hauser. Radial Sets: Interactive Visual Analysis of Large Overlapping Sets. Visualization and Computer Graphics, IEEE Transactions on 19.12 (2013): 2496-2505.

评论关闭。