在高维数据集中,数据之间的关系大致可分为两种,即显性关系和隐性关系。其中前者指的是直接包含两个对象的具体的联系(connection),而后者指的是对象之间的共同点(comment point),是相对抽象的联系。譬如两国之间,航线连接是其显性关系,而两国具有相同的气候类型则是一种隐性关系。由于隐性关系只能通过特定的数据查询来发现,多数的可视化方法都只表现了数据的显性关系。Jian Zhao等人[1] 提出了结合图(Node-link Graph)和动态查询(Dynamic Query)的可视化系统PivotSlice,通过在图布局中展现查询结果,并辅以灵活完善的交互功能,来辅助用户同时探索数据的显性和隐性关系。
PivotSlice的用户界面如图1所示,其中d区域为构造动态查询、显示查询结果的主要视图,e区显示各个查询结果之间关系,而a、b、c区域的功能分别是文本搜索、操作历史、以及数据统计信息的展示。在区域d中,构造查询及展示结果的原理如图2所示。其中矩形e表示针对某一变量的一个查询条件,各变量值之间为逻辑“或”关系,此处即b2 ∪ b3。而矩形b表示一次查询,其包含的各条件之间为逻辑“与”关系,此处即a1 ∩ ( b1 ∪ b2 )。在X或Y方向上都可以构造查询,a区域则被不同的查询划分为几个子区域,如c中Q11区显示了X1 ∩ Y1所对应的查询结果。特殊地,0号查询(X0、Y0)对应于所有未被该轴查询所包含的数据,即查询结果外的“其他数据”。通过与视图交互,用户可以动态添加或删除一次查询或查询的条件,并在表格形式的主视图(tabular view)里观察和比较不同查询返回的结果。在不断修改查询并分析查询结果的过程中,用户可以有效地厘清复杂的数据结构,探索数据之间的隐性关系。
数据的显性关系由图布局中结点间的连线来表示,如图3所示。当构造了新的查询后,查询结果所对应的数据点移动到相应的子区域里,从而将原图划分为几个子图,而重复出现在多个结果里的数据将被重复显示。在每个子图里,用户可以改变图的布局或是汇聚点集的信息,从而得到查询结果的数值分布及总体信息。譬如令图3中d区的力导向图(Force-directed Graph)按查询条件相应的属性值分布,可得到如f-g区的各个视图。如果在X、Y方向上同时指定了查询布局,即得到如g所示的散点图。在此基础上,用户也可以压缩某一查询并汇聚点集信息,如从Y轴上压缩g区域,可以得到如图3 (b)所示的汇聚视图。另外,不同的结果区域之间既有显性联系,也有数据的交集,图3所示的热图即表现了不同查询结果之间的相关关系。
图4所示为文本搜索和统计信息框图。在查询结果中选定一组数据后,后者可展现数据的详细信息,用户也可以从中选择数据的某些特性并添加到查询中以启动新一轮的查询。而文本搜索则允许用户查找特定的数据特征,并添加查询条件中去。系统还提供交互历史功能,记录最近的几次操作以方便用户修改并回溯自己的交互。另外,考虑到数据库本身会存在缺失数据、数据过时、记录错误等问题,PivotSlice在查询的基础上允许用户动态地编辑和维护数据库。借助系统提供的网络搜索功能,用户可以很方便地查找缺失的数据并实时更新到数据库中。
PivotSlice结合了图布局和动态查询,允许用户通过视图交互来编辑查询条件并分析查询结果,从而在表达数据显性关系的基础上,能较好地辅助数据的深入挖掘和持续分析,为隐性关系的探索提供了强有力的支持。其中图与表格相结合的形式,既保持了图布局中的点线关系,也发挥了表格的多视图优势,方便用户多层次、多角度地观察并比较各个查询之间的异同,是结合显、隐性关系的关键构件。而PivotSlice另一个优点在于其完善、灵活的交互探索机制,用户通过观察查询结果、可以发现新的数据特征并将其加入查询条件中,从而构筑起可持续进行、且逐步深入的数据探索过程,并在此过程中逐渐认识数据的全貌。
[1] Jian Zhao, Christopher Collins, Fanny Chevalier, and Ravin Balakrishnan. Interactive Exploration of Implicit and Explicit Relations in Faceted Datasets. IEEE Transactions on Visualization and Computer Graphics (TVCG), 19(12): 2080 – 2089, 2013.
评论关闭。