Progressive Learning of Topic Modeling Parameters: A Visual Analytics Framework
论文:Progressive Learning of Topic Modeling Parameters: A Visual Analytics Framework
作者:Mennatallah El-Assady, Rita Sevastjanova, Fabian Sperrle, Daniel Keim, and Christopher Collins
发表会议:IEEE VAST 2017
一、介绍
主题模型是一类用于将文档根据在其内部的主题分布归类的非监督机器学习方法。主要思路为,根据文档及其中的词汇建立起文档描述向量,从而求解出文档中的主题分布与每个主题中的关键词分布。主题模型是一类非监督的黑盒模型,本文希望能帮助理解主题模型的输出,并使得所用的模型适应当前数据与任务的特性,以增强模型的可靠性。而可视分析恰恰能通过人的参与和反馈,完成数据和任务驱动的模型构造过程。本文的主要贡献包括:
1.提出了一个有人参与的主题模型循序渐进改进方式
2.设计了四个根据四个任务驱动的可视化窗口
3.通过实证测试与定性实验验证了方法的有效性