10.3969/j.issn.1002-1965.2014.03.030
基于LDA的网络评论主题发现研究
网络用户评论的主题发现研究是Web2.0时代信息分析的重要方式,如何从冗杂的用户评论中分析出有价值的信息是研究的热点。针对网络用户评论信息内容短、信息量少的特征,提出基于LDA( latent Dirichlet alloca-tion)主题发现模型结合HowNet知识库进行信息分析的方法,对网络评论进行主题发现的研究。首先通过评论文本的词性标注、语义分析,形成语料库,然后利用HowNet对语料库中的词项进行语义相似度的计算,完成语义去重、合并,最后通过LDA主题模型将用户评论的内容映射到主题上,实现对用户评论信息主题的发现。
网络评论、主题发现、网络信息分析、LDA(latent Dirichlet allocation)、语义分析、文本挖掘
G350.7(情报学、情报工作)
2014-04-03(万方平台首次上网日期,不代表论文的发表时间)
共4页
161-164