10.3969/j.issn.2095-2163.2014.06.018
基于距离度量的实体识别算法
传统的实体识别中,往往是利用字符串相似性函数来计算元组对在每个属性值上的相似度从而来判断其总的相似性(例如,元组对的相似性等于每个属性值上的相似度的加权求和).然而这一类相似性测度不能够反映属性值内部不同的词在元组对相似性计算中的不同重要性.由于不能区分哪些词对元组对匹配更重要,就导致仍然存在某些匹配的元组相似性不高,而不匹配的元组相似性高的情况,故很难将匹配元组对和不匹配元组对有效区分开.为了解决这个问题,提出了以词为特征的距离度量函数,设计了基于词特征的距离度量学习算法,和基于距离度量的实体识别算法.扩展性实验对所提出的算法的有效性进行了验证.
实体识别、相似性测度、距离度量、度量学习
4
TP704.25(遥感技术)
国家自然科学基金61003046,61111130189,60933001;国家高技术研究发展计划8632012AA011004;中国博士后科学基金20090450126,201003447;教育部博士点基金20102302120054
2015-03-13(万方平台首次上网日期,不代表论文的发表时间)
共3页
61-63