10.11925/infotech.2096-3467.2018.0625
基于词向量和BTM的短文本话题演化分析
[目的]构建一种微博话题演化方法,正确把握话题发展趋势,提高网络舆情预警能力.[方法]使用Skip-gram模型在文本集上训练得到词向量模型,将每一时间片的微博文本输入BTM得到候选主题,在主题维上构造候选主题词向量;利用K-means算法对主题词向量聚类,得到融合后的主题,进而建立文本集在时间片上的话题演化路径.[结果]实验结果表明,本文方法话题抽取F值为75%,对比主题模型提高约10%,证明本方法的可行性.[局限]话题演化的衡量标准不一致,没有对比多种话题演化方法.[结论]本文方法能有效抽取各阶段话题,为网络舆情分析提供有效途径.
BTM模型、词向量、话题相似度、话题演化
3
G350(情报学、情报工作)
国家自然科学青年基金项目“大规模动态社交网络社团检测算法研究”项目71401130的研究成果之一
2019-05-23(万方平台首次上网日期,不代表论文的发表时间)
共7页
95-101