社会媒体主题竞争的可视分析 (Visual Analysis of Topic Competition on Social Media)

在Facebook、Twitter等社交网站日益发展的今日,社交平台上数十亿用户每天产生着无数的信息。然而,人们的关注点是有限的,只有少数的信息能够得到很多人的关注。因此,每天有大量的信息在争夺大众的眼球,从而有了主题之间的竞争。同时,在社交平台上也有一些具有很大影响力的用户,通常被称为“意见领袖”。但是,不同群体的意见领袖在主题的竞争中也扮演着不同的角色。意见领袖的群体分类由领域专家根据具体的事件进行判断,例如在总统竞选事件中,社交网站上的意见领袖可以分为三类:媒体 (Media),草根 (Grassroots),政治人物 (Political Figures)。

topiccompetition1

图1 系统界面示意图

这篇论文提出了一个可视分析系统,用以分析社交网站上主题间的竞争。该系统主要解决两个方面的问题:(1) 不同主题之间的竞争,(2) 在竞争过程中意见领袖所扮演的角色。
可视分析系统的主体是一个时间线视图 (Timeline View) ,它借用主题河 (ThemeRiver) 的形式来展示每个主题的发展和衰落,河流宽度表示该主题在对应时刻的热度。另外,不同类型的意见领袖用不同颜色的线 (Thread) 表示,如图1中橙色表示媒体,绿色表示草根,蓝色表示政治人物。这些线条穿插在不同的河流中,表示他们在对应的主题中产生了一定的影响力。类似的,线条的宽度表示对应类型意见领袖在对应主题中发挥的影响力。线条从一条河流转换到另一条河流表示意见领袖们的关注主题发生了变化,并且他们在新的主题中开始扮演重要的角色。线条可能会发生分裂或合并,表示意见领袖们的关注点发生了分裂到多个话题或回归到同一个话题中。
系统也提供了径向视图 (Radial View) ,它用来展示不同主题之间竞争力的转换。如图1C所示,圆周上分布着若干个点,表示了不同的主题。两个主题之间的连线表示对应两个主题之间产生了竞争和交互,并且人们的关注点从一个主题转向了另一个主题。连线的宽度表示了两个主题之间交互的强度,线条的颜色由浅到深,表示人群注意力从浅色端的主题转向了深色端的主题。
为了分析具体的语义内容,系统还提供了词云 (Word Cloud)。词的热度用其字体大小表示,并且在词的背景上展示了词的热度趋势。此外,在词云的圆周边界上,用户可以对主题和意见领袖进行筛选。

topiccompetition2

图2 “占领华尔街”运动期间社交网站上主题的竞争

下面我们来看看如何用该系统分析“占领华尔街”运动期间社交网站上主题的竞争。如图2所示,三个主题在2011年10月的第一周都比较稳定,但是在10月15日后竞争力迅速增长,并在22日附近达到高峰,随后这些主题都逐渐衰落。经过进一步分析,发现16日美国总统奥巴马公开支持抗议运动使得这三个主题的关注度大幅增加。在时间线中我们可以看出,在整个事件中,蓝色表示的抗议账号 (Protest Accounts) 一直占据主要地位。使用词云分析这些抗议账号发的 tweet 内容(如图2右下部分的词云所示),会发现 ”photo” 和 “posted” 在他们的 tweet 中大量出现,这说明他们在积极地传播相关新闻和报道最新的活动进展。另外,从时间线视图中可以很容易的发现,在事件初期,草根们还发挥着一定的作用,但是到15日之后,草根们的影响力被媒体所取代。通过词云分析事件初期草根账号的内容(如图2左下部分的词云所示),我们可以很容易发现 “arrested”, “nypd”, “police”, “brooklyn”, “bridge” 等词比较突出。通过进一步查看tweets内容和相关的新闻报道,发现10月2日发生在布鲁克林桥的逮捕抗议者事件引发了人们的关注。

从上面的例子可以看出,人们可以通过时间线视图、径向视图、词云等多个视图,有效地进行交互探索和分析,从而对社交网站上主题的竞争有更加清晰的认识。

[1] Xu P, Wu Y, Wei E, et al. Visual analysis of topic competition on social media[J]. Visualization and Computer Graphics, IEEE Transactions on, 2013, 19(12): 2012-2021.

评论关闭。