期刊专题

基于依存句法分析的微博主题挖掘模型研究

引用
近年来,微博成为人们获取与发布信息的重要方式,每天有大量微博数据产生,对其进行热点主题挖掘意义重大.数据挖掘中的聚类分析是挖掘热点主题的重要方法,但由于篇幅限制,传统聚类效果有限.本文据此提出用依存句法分析来改进传统文本相似矩阵,以提高聚类准确性.首先采用传统文本处理方法构建文本相似矩阵;再利用依存句法分析句子的结构,获取微博信息的依存树,找到有效依存词对,并据此计算文本相似度,构建另一个相似矩阵.综合两个矩阵得到更准确的微博文本相似矩阵,在此基础上运行聚类算法,挖掘出热点主题.最后根据评论数和转发数挖掘出重要主题与重要微博,完成微博主题的深入分析.

热点主题、依存句法分析、依存树

33

G254(图书馆学、图书馆事业)

国家自然科学基金71273194

2015-10-10(万方平台首次上网日期,不代表论文的发表时间)

61-65

暂无封面信息
查看本期封面目录

情报科学

1007-7634

22-1264/G2

33

2015,33(9)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn