10.3772/j.issn.1000-0135.2010.04.016
基于双序列比对的中文术语语义相似度计算的新方法
针对中文术语的语义相似度计算问题,本文首先用数学语言对其进行了描述,然后仔细分析了求解该问题的传统计算方法,结果发现传统计算方法大都做了一个隐式假设:组成两个术语的原子术语的顺序必须大体一致.换句话说,传统计算方法并没有考虑原子术语顺序的差异对构建两个术语的原子术语间对应关系质量的影响.为克服这个问题,通过类比分析,本文认为可将该问题看作一个全局双序列比对问题,因而引入生物信息学领域中著名的全局双序列比对算法(NW算法).理论及实验研究均表明,在绝大多数情况下,该方法优于传统方法,或至少与传统方法的效果相当.
语义相似度计算、序列比对、语义知识库
29
TP3;TN9
"十一五"国家科技支撑计划"知识组织系统的集成及服务研究与实现"2006BAH03B03;中国科学技术信息研究所重点工作项目"汉语科技词系统建设与应用工程新能源汽车领域"2008KP01-3-1
2010-09-07(万方平台首次上网日期,不代表论文的发表时间)
共8页
701-708