10.3969/j.issn.1002-137X.2010.11.037
一种基于LDA的在线主题演化挖掘模型
基于文本内容的隐含语义分析建立在线主题演化计算模型,通过追踪不同时间片内主题的变化趋势进行主题演化分析.将Latent Dirichlet Allocation(LDA)模型扩展到在线文本流,建立并实现了在线LDA模型;利用前一时间片的后验概率影响当前时间片的先验概率来维持主题间的连续性;根据改进的增量Gibbs算法进行推理,获取主题-词和文档-主题的概率分布,利用Kullback Leibler(KL)相对熵来衡量主题之间的相似度,从而发现主题演化中的"主题遗传"和"主题变异".实验结果表明,该模型能从互联网语料中找出主题的演化趋势,具有良好的效果.
主题模型、LDA、演化、舆情
37
TP310(计算技术、计算机技术)
国家自然科学基金重点项目60933005;面上项目60873204
2011-01-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
156-159,193