10.3969/j.issn.1002-1965.2019.04.028
一种基于爬山算法的学科领域热点探索模型
[目的/意义]热点发掘一直是图书馆领域的重点研究内容之一,通过共引和共词分析探测学科领域热点都存在一定的局限性,针对存在的问题,借鉴爬山法进行改进研究.为适应大数据时代的热点挖掘问题,将计算机算法与文献关键词分析相结合,构建研究热点分析模型,探索分析研究热点的方法,对于学科领域研究热点具有重要意义.[方法/过程]采用改进的Apriori-Hill-Mount爬山算法,拓展关键词共现分析和聚类方法,构建了篇与篇之间的关键词的关联规则挖掘模型;通过实证研究科学计量学及图书情报学两个领域,论证该模型的可行性.[结果/结论]通过对上述两个领域的文献进行篇-篇关键词强关联规则挖掘和分析,分别得到各自领域的的研究热点;其结果与采用Citespace及Spss呈现的热点有很高的吻合度.但该算法揭示的信息更全面、更直观地呈现研究主题热点,对学科热点探索体系方法及手段具有一定的补充及辅助作用.该方法是在一个局部范围内进行搜索,且阈值的设定也具有人为因素,因此得到的可能是局部的优化,其更大范围的可适性有待进一步论证.
Apriori-Hill-Mount、关联规则、热点探索、数据挖掘
38
G256(图书馆学、图书馆事业)
国家社会科学基金一般项目"开放科学理念下的科研数据治理研究"17BTQ025的研究成果之一
2019-05-16(万方平台首次上网日期,不代表论文的发表时间)
共7页
187-193