DOI：10.3969/j.issn.1002-137X.2013.06.043

基于百度百科的词语相似度计算

引用

摘要：

词语相似度计算是自然语言处理的关键技术之一,是一个被广泛研究的基础课题.传统的词语相似度量方法大多是基于语义知识和基于语料库统计的方法,即这两类方法需要具有层次关系组织的语义词典和大规模的语料库.提出了一种新的基于百度百科的词语相似度量方法,通过分析百度百科词条信息,从表征词条的解释内容方面综合分析词条相似度,并定义了词条间的相似度计算公式,通过计算部分之间的相似度得到整体的相似度.实验结果表明,与已有的相似度计算方法对比,提出的算法更加有效合理.

关键词：词语相似度、语言网络、百度百科、向量空间模型

所属期刊栏目：40

分类号：TP311(计算技术、计算机技术)

资助基金：国家自然科学基金70871115

在线出版日期：2013-07-10（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：199-202

英文信息展示

期刊专题