学术实体的影响花朵 (Influence Flowers of Academic Entities)

对学术实体影响的分析可以帮助人们更好地了解一个实体在学术界的生产力和声誉,并了解知识的创造过程。但已有的工作大多致力于影响力的量化。本文[1]提出了一种名为影响花朵(Influence Flower)的新的隐喻形式,能够展示实体之间影响的流动。

本文提出了影响花朵,来展现不同实体之间影响的流动过程。特别的,影响花朵主要关注与某个特定的中心实体有关的影响流动。在进行设计之前,作者提出了以下三点的设计准则:

  1. 需要特别关注影响。
  2. 在深度和广度之间进行取舍。该工作选择覆盖所有学科以及全部的实体类别来保证足够的广度。
  3. 在信息丰富度与简约程度之间进行取舍。该工作在展现了足够多的细节的同时,仅关注实体之间简单的关系,即实体之间的直接影响。

总体来说,该工作做出了如下的贡献:

  1. 提出了名为影响花朵的视觉隐喻形式。
  2. 在影响花朵的基础上设计了可视分析系统。
  3. 使用了丰富的案例分析来验证影响花朵的可行性。

该工作的数据来自于微软学术图(MAG),一个覆盖了所有研究领域的开源学术数据集。该数据集包含6个实体的类别:论文、作者、机构、地点(期刊和会议系列)、事件(会议等)和主题。

在此数据集的基础上,该工作设计了搜索页面来支持用户指定一个中心实体。用户可以在搜索页面中搜索并添加不同类别的中心实体,并可以将多个实体进行聚合。

图1. 搜索页面

而在用户指定了中心实体之后,便会生成影响花朵。在生成花朵之前,先需要计算影响的大小。该工作将文章的引用作为影响的基本单位。如果实体A中的一篇文章引用了实体B中的一篇文章,则认为实体B给予实体A一个单位的影响。在计算完影响大小之后,便生成了如下图的影响花朵:

图2. 影响花朵

其中,中心节点为指定的中心实体,外围节点为与中心实体之间互相影响较多的实体。节点的大小代表影响的总数;蓝色越深代表实体给予中心实体的影响越多,红色越深代表实体受中心实体影响越多;每条边的宽度代表影响的数量。用户可以指定花瓣的数量,最多50瓣。

同时,该工作也支持不同花朵之间的比较。但目前只支持相同中心实体、相同外围实体类别的花朵之间的比较。

图3. 不同花朵之间的比较

在展现了影响流动的同时,该工作也设计了详细信息页面来展现每条边后隐含的信息。在用户指定了某一个外围实体之后,该页面的左边会列出外围实体对中心实体有影响的文章,右边会列出外围实体被中心实体所影响的文章,而在中间则会列出中心实体与之相关的文章。

图4. 详细信息页面

最后,本文做了一些案例研究来验证影响花朵的可行性。其中,在案例5中,作者将影响花朵应用到了社交媒体数据中,来分析Yann LeCun的账号在社交媒体中的影响流动。该案例也能够展现影响花朵的可扩展性。

图5. 对Yann LeCun在学术界中的分析及在社交媒体上的分析

[1] Minjeong Shin, Alexander Soen, Benjamin T. Readshaw, Stephen M. Blackburn, Mitchell Whitelaw, and Lexing Xie. Influence Flowers of Academic Entities. IEEE Conference on Visual Analytics Science and Technology, 2019.

评论关闭。