10.13833/j.issn.1007-7634.2021.08.020
关键词词频及语义特征对科技文献聚类的影响研究
[目的/意义]针对基于关键词的科技文献聚类研究进行了一些探讨,包括:使用具有不同特征的关键词来实现文献聚类在效果上有何差异;如何按特征对关键词进行选择来提高文献聚类效果.[方法/过程]按照关键词词频与语义类型特征设置对照组进行实证研究,观察其对文献聚类密度及文献语义表示效果的影响.[结果/结论]单独使用具有超高频、次高频、研究主题或限定范围特征的关键词进行文献聚类能使聚类密度较为合适;超高频特征通常在其他频次中都具有体现,次高频词能同时反映不同频次的关键词特征,但次高频词对中频词特征的表示不够全面;将语义类型不同的关键词分开来实现文献聚类,其效果好于将关键词进行组配,语义类型不同的关键词间存在互斥性.[创新/局限]本文发现了在以关键词间的共现关系为基础来进行文献聚类时单独选择次高频或某一语义类别的关键词来实现文献聚类具有较好效果,但缺少对关键词间语义结构关系的进一步研究.
词频;关键词语义;科技文献聚类;社会网络分析
39
G254(图书馆学、图书馆事业)
国家社会科学基金年度项目"融合知识图谱和深度学习的在线学术资源挖掘与推荐研究"19BTQ005
2021-08-31(万方平台首次上网日期,不代表论文的发表时间)
共8页
156-163