10.3969/j.issn.1002-1965.2017.02.017
基于改进的OLDA模型话题检测及演化分析
[目的/意义]话题检测和演化分析是网络舆情监控中的热点问题,对热点话题的检测和演化分析有助于挖掘热点话题和深入理解话题的演化趋势,并给以舆情监控者提供完整的话题演化路径和更为合理的决策意见.[方法/过程] OLDA(Online Latent Dirichlet Allocation)模型是用于挖掘热点话题和分析话题演化的工具,由于其存在新旧主题混合、冗余词较多的缺点,采用双通道模式对主题、词分布的遗传度进行改进,并给出了新的词分布计算方法.[结果/结论]提出的改进OLDA模型解决了新旧主题混合问题,降低冗余词的概率,更为明确地解释话题的含义.实验表明,改进的OLDA模型更为有效地对话题进行检测及演化分析.
网络舆情、OLDA模型、话题演化、话题检测、Gibbs采样、特征字
36
C931.6(管理学)
教育部人文社会科学研究项目“云计算环境下企业知识组织与知识门户系统研究”2012JYRW0710;国家自然科学基金项目“基于制造大数据的产品研发知识集成与服务机制研究”71671057
2017-05-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
102-107