SightBi:使用双簇探索跨视图数据关系(SightBi: Exploring Cross-View Data Relationships with Biclusters)

图1: SightBi系统界面

多视图可视化 (MV) 大量用于可视化分析工具,用于对各个领域的数据有重要意义,其中一项常见任务是将跨不同视图的数据关联起来。目前,探索跨视图数据关系严重依赖于视图协调技术,如刷选和链接,这可能需要用户在许多尝试中付出大量努力。为了解决这个问题,SightBi 将跨视图数据关系形式化为双簇,并使用双上下文设计突出创建独立的关系视图,在保留现有视图的基础上,提供跨视图数据关系的概览以指导用户探索,并允许用户使用新创建的关系视图以交互方式管理多个视图的布局。 SightBi 的界面如图1所示。

SightBi [1] 的界面如图1所示。本文的核心思想是通过计算,去节省用户在寻找不同域连接实体集的时间。本文的双簇将两个相关的实体集聚类到相关的子集中。这种相关的子集对是一个双簇,其中一个集合中的实体与另一个集合中的实体相关。基于共享实体,双簇可以链接在一起形成双簇链,从而计算一对视图之间或几个视图之间的数据关系,如图2所示。

图2: 三种类型的跨视图关系:(a)视觉元素之间,(b)视图之间,(c)视觉元素和视图之间。

SightBi使用关系数据模型,通过三个关键步骤创建。第一步,从视觉元素反向映射成每个视图的表格。每个视觉元素和数据都与一个唯一的ID相关。第二步创建一个联合表,将一个视图的视觉元素的ID与另一个视图的ID联系起来,对于不同的场景,数据关联的方式可能是不同的。第三步将每个联合表转变成一个数据矩阵,其中行和列是来自两个视图的视觉元素ID ,如图3所示。

图3: 创建数据模型的步骤

基于共享实体可以形成双簇链,跨视图数据关系可以扩展到涵盖两个以上视图的可视元素。SightBi 使用四步方法从每个相关视图中获取连接的视觉元素集。第一步计算所有视图对的双簇。例如,给定的一组视图{A,B,C} ,所有视图对为{AB,BC,AC}。对于每个视图对,计算由视觉元素组成的双簇。第二步获取给定视图集的序列。 例如, 给定视图集 {A,B,C} ,它们排列为{ABC,ACB,BAC}。第三步构建双簇链。基于每个视图序列,如ABC,分成连续的相邻视图对,如AB和BC。对于每个相邻视图对,我们从第一步中找到计算出的双簇。根据相邻视图对的序列,基于它们在同一视图中的共享实体将相应的双簇链接在一起,并使用公式(1)来计算在一个视图中共享视觉元素的两个双簇之间的匹配分数(matching score)。

公式1:匹配分数的计算方法

第四步获取选定的双簇链。针对步骤三的双簇链集,检查两种情况决定是否将其保留为选定的双簇链: (1)该链是否是双簇链集中任何其他链的子集;(2) 双簇链集中的任意其他链是否是该链的子集。如果两者都不是,则该链是选定的双簇链,算法 1展示检查的过程,此步骤确保双簇链之间不存在包含关系。

算法1:选定不存在包含关系的双簇链集

在双簇可视化的部分,作者确定了 SightBi 设计的四个主要考虑因素。

C1:设计关系编码,(a) 数据关系的编码应该在感知上与现有视图中的视觉编码区分开来,以便用户可以轻松识别数据关系。(b) 数据关系编码的设计应避免干扰用户对现有视图的感知,这有助于保留现有视图。(c) 数据关系编码应该揭示属于数据关系的视觉元素以指导用户探索,这有助于用户检查关系的详细信息。(d) 数据关系的视觉编码应该在关系状态更新时显示变化。

C2:支持六种探索方式。本文的目标是支持实现灵活的用户探索,而用户探索可以从两个维度来考虑。一个维度是由实体或关系驱动的用户探索。另一个维度是用户探索是保持在同一视图中还是切换视图。因此,对于面向连接的任务,有六种可能的用户探索方式,如表 1 所示。

表1: 六种用户探索方式

C3:组织关系和视图。这可以简化查找有价值的数据关系的搜索过程,有组织的布局可以作为数据关系的概览,与随机放置关系的布局相比,它可以更好地指导用户探索。此外,用户可能希望以个性化、有意义的方式灵活地组织多个视图以进行有意义的构建。

C4:按需引用原始数据。为了帮助用户检查和理解计算出的跨视图数据关系,显示原始数据是必要的。用户需要参考原始数据来了解详细的上下文,这有助于他们验证可能暗示某些假设的计算关系。

SightBi 使用双上下文的设计,通过创建额外的视图来显示跨视图数据关系 ,将编码数据关系的视觉标记与现有视图分开。因此, SightBi 可以提供两种类型的上下文,一种由现有视图组成,另一种来自新添加的关系视图。这样可以帮助用户区分关系与其所涉及的实体 ,有助于保留现有视图,用户对它们的感知不会受到新添加关系视图的显着影响。这种双上下文设计支持所有六种用户探索方式,用户可以选择从哪里开始探索,并切换上下文使用。

SightBi 支持为跨视图数据关系的双组级别和多组级别创建关系视图,对它们使用相同的视觉编码。图 4 显示了双组级关系视图的视觉编码示例,它将地图 (b1) 中的位置与列表 (b2) 中的组织相关联。在关系视图(a)中,每个计算出来的双簇或双簇链显示为一个圆圈,其半径通过使用线性映射函数显示所涉及元素的总数。双簇或双簇链中的元素越多,圆的半径就越大。当用户单击或将鼠标指针悬停在一个圆圈,颜色变深。在用户选择使用圆圈上的右键菜单来标记圆圈后,圆圈的颜色会变为红色。圆的位置是用多维缩放(MDS)计算的。两个圆的相对距离揭示了两个双簇或双簇链之间的相似性。

图4: SightBi的视觉编码

针对每个双簇或双簇链,SightBi 允许用户对其进行详细查看。SightBi 为双簇或双簇链提供两个详细级别:细节级别和摘要级别。具体的细节层次允许用户看到属于的视觉元素双簇或双簇链 ,通过曲线将视觉元素与双簇或双簇链进行视觉连接。蓝色曲线显示自动视觉链接,红色是用户创建的视觉链接。摘要级别为用户提供了 双簇或双簇链的快速概览,它将圆圈变为迷你条形图,其中所有条形都水平对齐。条的高度显示了视图中属于双簇或双簇链的可视元素的数量。这些条按显示空间中显示的现有视图的顺序排列。

图5: SightBi 在 Crescent 数据集上的应用

SightBi为计算数据关系提供了一系列用户交互操作,帮助用户查看和检索相关信息并组织信息,包括调整视图大小,固定和拖动视图,当用户选择或悬停视觉元素时显示链接,检索原始数据等。

为了更好地了解SightBi的使用情况,作者对两位专家进行访谈。根据他们反馈,曲线有利于跟踪和浏览从一个视图到另一个视图的相关信息。关系视图可以使用户在寻找聚类时节省很多精力。在摘要视图的帮助下,用户不需要检查图中的每个节点。然而,有时使用关系视图会带来一些问题,用户必须移动一些视图以留出空间,否则就会覆盖其他视图。专家们还为改进SightBi提出了建议,第一个是推荐机制,告诉用户哪些链接是有价值的。第二个是用自动方法来组织多个视图,而不是手动布局。

参考文献:

[1] M. Sun, A. R. Shaikh, H. Alhoori and J. Zhao, “SightBi: Exploring Cross-View Data Relationships with Biclusters,” in IEEE Transactions on Visualization and Computer Graphics, vol. 28, no. 1, pp. 54-64, Jan. 2022.

评论关闭。