作者存档: han, yun

流式文本的在线可视分析(Online Visual Analytics of Text Streams)

1

现如今的互联网上有大量的流式文档,一个很普遍的问题就是如何检测和跟踪这种文本流中的新兴事件。目前在挖掘和可视化文本流方面已经取得了很大的进步。然而,大多数现有的方法都是离线方法。离线的方法是基于所有文档来计算结果的。每次当新文件流入时,这些方法都会先将新文档与旧文档合并,然后重新计算模型。目前使用的这些离线方法存在两个主要的问题:
1. 重新计算模型时间消耗太大;
2. 由于模型被重新计算,结果在一定程度上发生了变化,这对用户来说可能是难以理解的。
这篇文章[1]提出了一种在线的可视化分析方法,帮助用户探索和了解大量流式文档中的层次主题演化。

继续阅读 »