基于语义网络的研究兴趣相似性度量方法


[目的]为准确识别研究内容相似但使用不同关键词的作者关系,解决传统共现分析方法缺乏语义关联的问题,提出一种基于关键词语义网络构建的作者研究兴趣相似性度量方法.[方法]通过引入word2vec模型对作者关键词进行词向量表示,将关键词表示成语义级别的低维实值分布;计算关键词之间的语义相关度并构造关键词语义网络,采用JS距离对构建的作者研究兴趣矩阵进行相似性度量.[结果]该方法能计算出共现及非共现词对的相关性,有效地挖掘出作者之间的潜在合作关系.[局限]训练语料的数量和准确性有待进一步提高,提出的度量方法仅考虑两个作者之间的潜在合作关系.[结论]研究结果对改进基于传统的共现分析方法度量作者合作关系具有重要的参考价值.
作者关键词网络、神经网络语言模型、语义相似度、研究兴趣矩阵
G250(图书馆学、图书馆事业)
本文系国家自然科学基金项目“科研团队动态演化规律研究”项目编号:71273196、山东省重点研发计划项目“可定制大数据知识服务平台关键技术研究及应用”项目编号:2015GGX101037和山东省科学院青年基金项目“基于本体标注的科技文档挖掘方法关键技术研究”项目编号:2013QN036的研究成果之一.
2016-06-16(万方平台首次上网日期,不代表论文的发表时间)
81-90