Origraph:交互式网络整理(Origraph: Interactive Network Wrangling)

在可视化领域网络数据的探索是十分普遍的,比如社交媒体中的一些网络分析,也因此存在一系列的可视化形式和系统。但是很少有工作关注最初网络模型的构建。事实上,网络分析所基于的源数据通常是从在线数据源爬取的,基本形式是一系列的数据项和它们的属性,也就是表格数据的形式。依据不同的假设,我们可以从数据中抽象出不同的网络模型。为了探索不同的网络模型,我们需要通过编程将数据转换为我们需要的网络数据,而这样一个过程是繁琐低效的。

现有的网络整理工具中最著名的是Ploceus[1]和Orion[2],主要聚焦于初始网络模型的创建。但它们不能通过结点和边的相互转换等操作迭代和交互地重构网络模型的网络整理工具。而其它支持的操作,比如基于连接性的过滤,只能通过编程进行实现。 因此,该文章[3]提出交互式的可视化网络整理工具Origraph (见图1),在已有工具的基础上对网络模型的操作集合进行扩展,帮助用户快速有效地创建和修改网络模型。

图 1:Origraph系统总览

首先介绍系统支持的操作。文章将操作分为三类,分别是模型操作,数据项操作和属性操作。模型操作通过引入新的结点或边类从而修改网络模型和网络的拓扑结构。数据项操作通过删除或引入数据项从而修改网络的拓扑结构。属性操作通过操作属性从而生成新的结点或边类,或者向已有类中增加新的属性。

  • 模型操作。包括建立和删除结点类与边类之间的连接,原理和数据库中的主键/外键匹配思想类似;将属性变为新的结点或边类,从已有类的属性列中提取出互不相同的值形成新的类(见图2);将类拆分为子类,依据某一属性列的值对类进行划分;边类与结点类的相互转换,可以将结点类变为边类或者反向操作(见图3);边的投影,通过结点之间的路径引入新的边。
  • 数据项操作。包括基于属性的过滤,通过限制类在某一属性上的值删除一些数据项;基于连接的过滤,通过连接性限制某一个类在另一个类上对应属性的值删除一些数据项。
  • 属性操作。包括在类内衍生出新的属性,通过类内的属性生成新的属性;基于连接衍生出新的属性,通过连通的类衍生出新的属性(见图4)。
图 2:将属性变为新的结点类和边类
图 3:边类与结点类的相互转换
图 4:基于连接衍生出新的属性

然后是系统设计。系统包括三个视图,分别是网络模型视图、属性视图和网络采样视图。

  • 网络模型视图。在该视图中,网络模型表示为node-link图,包含若干结点类和边类。结点类使用圆形表示,边类使用直线表示。结点类和边类之间可以通过关系边进行连接。每一个类是一系列数据项的集合,标明类名和数据项的数目。该视图支持的操作包括建立类之间的连接、边类的投影和边类与结点类的相互转换等。
  • 属性视图。在该视图中,以表格的形式呈现所有类的属性列和数据项。支持的操作包括将属性变为新的结点或边类、将类拆分为子类、基于属性的过滤、基于连接的过滤、在类内衍生出新的属性和基于连接衍生出新的属性。
  • 网络采样视图。在该视图中,使用力导向布局的node-link图展现完整网络数据的采样结果。使用的是深度优先采样算法,保证采样的结果是连通的。采样网络可以帮助用户快速地判断操作的效果。而对于完整网络数据,用户可以将结果导出,然后使用Gephi等软件进行探索。

最后它通过案例分析证明系统的有效性。其中一个案例是探索电影中参演人员的男女比。通过可视化的交互操作,用户可以快速有效地得到最终的网络模型(见图1)。

Reference:

[1] J. Heer and A. Perer. Orion: A system for modeling, transformation and visualization of multidimensional heterogeneous networks. Information Visualization, 13(2):111–133, Apr. 2014. doi: 10.1177/1473871612462152

[2] Z. Liu, S. B. Navathe, and J. T. Stasko. Ploceus: Modeling, visualizing, and analyzing tabular data as networks. Information Visualization, 13(1):59–89, Jan. 2014. doi: 10.1177/1473871613488591

[3] Bigelow, Alex, et al. “Origraph: Interactive Network Wrangling.” arXiv preprint arXiv:1812.06337 (2018).

发表评论?

0 条评论。

发表评论


注意 - 你可以用以下 HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>