搜索结果 标签: 多主题演化

TextFlow:分析文本的主题演化

了解文本数据中的主题演化是非常有用的,它可以帮助人们快速知道海量文本中的关键主题,了解相关领域的最新信息以及这些信息的变化情况,也可以帮助人们分析这些变化的原因。因此,文本挖掘领域以及可视化领域的研究人员都在主题演化方面做了很多工作,但是这些工作基本上都是围绕着单个主题的演化,很少有研究多个主题之间的合并与一个主题分裂成多个主题的情况。因此这篇发表在InfoVis 2011的文章“TextFlow: Towards Better Understanding of Evolving Topics in Text”就提出了这样一种能够分析多个主题演化关系的文本分析工具。

TextFlow系统的输入是一些带有时间标签的文本集,比如说从2001年到2011年在VisWeek上发表的所有文章,或者某段时间的全部新闻,这些文本集经过TextFlow内部的文本处理和挖掘之后,以可视化的方式呈现出这些文本的主题在这段时间的演化,包括某个主题的产生、结束,不同主题的合并,以及一个主题分裂成不同的主题等等这些情况。

首先看一下TextFlow的主要可视化界面:

继续阅读 =>