GUIRO: 用户引导的矩阵重排序 (User-Guided Matrix Reordering)

矩阵可视化是主要的关系(或网络)数据可视化技术之一。如果其布局能够揭示底层的数据拓扑结构,则最为有效。不同的矩阵排序算法带来不同的视觉模式,它们的可信赖性和可解释性是个值得研究的问题。 该工作[1]介绍了一种可视化分析系统来帮助新手、网络分析师和算法设计人员打开排序算法黑匣子,从而帮助用户更好地了解复杂的重排序过程,进而支持数据和重排序算法的见解。

矩阵可视化在展示关系/网络数据时有以下优点:

  • 可扩展性好
  • 没有过度绘图的问题
  • 概述+细节图在一张图里呈现

合适的重排序可以展示不同的视觉模式,如下图所示。

矩阵表示形式的视觉模式

其中,(1)展示了网络中的cliques,(2)展示了bi-cliques,(3)中平行于矩阵对角线的线表示通过网络的路径,(4)表示一个高度连接的顶点,(5)(6)(7)这一类的反模式 (anti-pattern) 没有显示有用的拓扑信息。

对维度为n的数据,有(n! × n!)/2 种维度排序方式。不同的排序方式令矩阵展示出不同的视觉模式(如下图所示),其中只有少部分能展示出有用的拓扑结构信息。

同一个图数据的不同矩阵表示

 

矩阵重排有两种类别,一种是自动矩阵重排,通常基于对一些质量指标的优化或者可见结构的出现来得到排序结果;另一种是交互式矩阵重排,利用用户可操纵的过程得到排序结果。

本工作研究如何解决以下几个问题:

  • Which matrix reordering algorithm to choose?
  • What is hidden in my data?
  • How to design better reordering algorithms?

针对大众用户、网络分析师、算法设计人员的三种不同应用场景,列举出以下几个任务:

  • T1: Compare result usefulness.
  • T2: Demonstrate patterns variability.
  • T3: Reveal the heuristic nature of (many) algorithms.
  • T4: Global pattern analysis.
  • T5: Nested pattern analysis.
  • T6: Detect (local) pattern relationships.
  • T7: Adapt visual results to emphasize analytic importance.
  • T8: Inspect Quality Metrics.
  • T9: Comparing/Weighing up of Design Decisions.
  • T10: What-if Analysis.

作者介绍了可视化分析系统GUIRO,它可以提高矩阵重排序算法的透明度,从而帮助新手、网络分析师和算法设计人员等广泛的用户更好地了解复杂的重排序过程,进而支持数据和重排序算法的见解。系统界面如下图所示。

GUIRO系统界面

用户可以研究超过70种可访问的矩阵重排序算法的有用性和表达性。对于网络分析人员,利用排序结果的二维空间表示形式和两种交互技术,可以实现用户指导的行或列或者所选中子矩阵的重新排序,有助于理解全局和局部数据集拓扑。算法设计人员可以使用16种重排序质量指标和可视化探索手段来比较行/列排列级别上的重排序算法。文章通过用户研究对GUIRO的评估和案例研究证明了GUIRO在现实世界中的有用性,同时经由专家研究收集了反馈,展示了该系统对上面提出的分析任务的支持。

下图展示了用户可控制的矩阵重新排序的处理流程。矩阵的行/列被解释为高维向量并投影到二维空间中,形成一组顶点的空间。 相似的向量被投影到相似的二维空间位置。 连接所有顶点的路径展示了矩阵重排序结果。 用户通过选择顶点组可以在子矩阵上本地应用重排序算法。 用户可以手动修改路径,以便本地优化子矩阵或单个顶点的放置。

用户可控制的矩阵重新排序的处理流程

用户可以直接连接两个顶点来进行边替换,实现维度重新排序。有两种策略,如下图所示。

边替换的两种重排策略

下图展示了利用该系统进行矩阵排序的例子。在全局矩阵重排序算法不能带来令人满意的重排序结果的情况下,GUIRO可以帮助揭示隐藏的矩阵子结构。 用户首先将Optimal-Leaf-Ordering(一种分层聚类算法)应用于数据集。 发现该算法的结果在对角线上有许多不同的簇,但无法揭示右上和左下区域的结构。 Kernel PCA的二维投影结果展示了一个大型集群和两个子集群。 左上角投影群集的套索选择显示出左上角零散的行/列与矩阵中现有的右下角的块有关。 使用MultiScale算法重新排序此子矩阵,发现其对矩阵右上角的视觉效果有重大影响,但在该象限仅轻微反映出非对角结构。选择和重新排序另一个投影群集,发现其对矩阵的整体外观影响很小。

利用系统进行矩阵排序的例子

总的来说,本文所提出的视觉分析系统可以用于用户可控的矩阵重新排序过程,帮助用户了解并引导矩阵重新排序,进而支持数据和重排序算法的见解。

参考文献:

[1] Behrisch, Michael, Tobias Schreck, and Hanspeter Pfister. “GUIRO: User-Guided Matrix Reordering.” IEEE transactions on visualization and computer graphics, 2019.

评论关闭。