融合关键词增补与领域本体的共词分析方法研究
针对传统共词分析中的不足,提出一个新的共词分析过程模型,该模型从两个方面对传统共词分析方法进行改进.首先,自标引关键词不能全面描述论文主题内容,需对其进行增补.选择高频自标引关键词构成增补词典,利用基于增补词典的分词技术从标题中提取论文候选关键词,按一定规则进行增补.其次,针对共现频次较难准确描述词对相似度,引入领域本体来计算高频关键词对的语义相似度,综合考虑共现频次和语义相似度值得到词对的相关度值.用相关度来描述词对相似度,并作为构建共词矩阵的依据.最后通过实验证明改进方法的有效性.
共词分析、增补词典、领域本体
TP391(计算技术、计算机技术)
国家自然科学基金项目“社会化媒体集成检索与语义分析方法研究”项目71273194的研究成果之一
2013-12-31(万方平台首次上网日期,不代表论文的发表时间)
共8页
60-67