期刊专题

10.13663/j.cnki.lj.2018.11.014

基于共现分析的文本主题词聚类研究

引用
本文将共现分析应用于非结构化文本文件,挖掘文本主题的语义关联.由于文本文献不同于科技文献,缺少关键字等描述信息,本文引入主题模型对文本进行语义降维,生成的主题词作为共词分析的研究对象.实验发现中频主题词能更好地反映文本的主题特征,为此,本文结合齐普夫定律和同词频理论选取中频主题词,通过共词分析识别语义关联,并采用K-means聚类算法实现主题词的聚类.本文以“创新创业”相关新闻文本进行实验,实现文本集主题词的聚类,通过实验对比分析,本文的方法能够更好地体现文本主题的语义联系.

主题模型、齐普夫定律、共词分析、主题词聚类

TP391;G254.2;R197.1

2018-12-27(万方平台首次上网日期,不代表论文的发表时间)

共7页

99-104,119

相关文献
评论
暂无封面信息
查看本期封面目录

图书馆杂志

1000-4254

31-1108/G2

2018,(11)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn