10.3969/j.issn.1002-1965.2021.05.020
基于中心词和LDA的微博热点话题发现研究
[目的/意义]通过引入中心词概念,提出一种改进LDA主题模型,以期在微博热点话题发现中获得更好的话题分布效果.[方法/过程]以微博热点数据为研究对象,进行文本表示学习,将基于Bert和Word2Vec的模型设为实验组,基于TF-IDF和BOW的模型设为对照组,令实验组和对照组分别生成改进LDA模型和传统LDA模型.[结果/结论]通过对比传统LDA模型和改进LDA模型,发现改进方法所生成的LDA模型在高频词分布集中度上更优于传统方法,在下游任务应用中更适合热点话题生成.
中心词、Bert、吉布斯抽样、LDA、微博热点话题
40
G353.1(情报学、情报工作)
2021-05-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
143-148,164