微博可视化-II 标签云与Wordle

标签云是一种使用广泛的可视化方法,它根据标签的热门程度来确定其字体大小,我们在许多网站、博客上都能见到它的身影。

    Cloud.li(http://cloud.li/)就是一种基于搜索引擎的可视化工具。用户输入某一个关键词,该应用会查询Twitter上与之联系密切的词语,并以标签云的形式展现出来。频率越大的单词其字号越大,颜色也越深。下图便是笔者在Iphone4s发布前夕搜索“Apple”得到的结果。我们可以很清楚地看到,iphone占据了绝对重要的地位,另外诸如iphone4siphone5store等词语也可以很容易地找到。

Wordle是一种比较流行的将文本中关键词可视化的方法。它极具视觉美感,可以在短时间内在感官上给人冲击,吸引住读着,并能让使用者轻易地抓住文本中最主要的关键词。下面的图便是一张Wordle的图Wordle同样是使用字体大小来表示词语的权重,通过把关键词按照一定外轮廓紧密地排列达到美观的效果。

图片来源:http://www.flickr.com/photos/koranteng/526642309/in/set-72157600300569893

下面的这张图是将与奥巴马有关的关键词用Wordle的方式排布成的奥巴马头像,这张图首先用其视觉冲击吸引了读者,然后让读者能够一眼发现几个比较重要的关键词,比如BushBarackNews等。


图片来源:http://mathaba.net/news/?x=620748

另外,在国内人人网和新浪微博上也都有Wordle的应用。下图便是由清华大学自然语言处理组开发的一个自然语言处理的应用(应用名称:微博关键词。在人人网上也有同样的应用“人人关键词”),它分析用户最近所发的微博内容并提取其中关键词,然后通过Wordle的可视化方式展现出来。下面这张图是新浪微博上粉丝数排名第三的蔡康永的关键词的可视化结果。

图片来源:http://app.thunlp.org/weibo/image/1282005885.png

评论关闭。