10.3778/j.issn.1002-8331.1405-0113
结合互信息和主题模型的微博话题发现方法
为了解决短文本信息流的特征稀疏性对热点话题发现带来的挑战,提出了结合词语互信息和概率主题模型的微博热点话题发现方法。通过建立词共现矩阵并应用对称非负矩阵分解算法获取词项-主题矩阵,再利用概率潜在语义分析模型进行主题发现,最终通过定义微博热度分析和排序,有效地支持微博热点话题发现。实验表明,此方法能有效地进行话题聚类并检测出热点话题。
词共现矩阵、对称非负矩阵分解、概率潜在语义分析、微博热点话题发现
52
TP391.1(计算技术、计算机技术)
国家自然科学基金No.61163039,No.61363058;甘肃省教育厅项目No.2013A-016。
2016-04-27(万方平台首次上网日期,不代表论文的发表时间)
共6页
61-66