利用术语定义的汉语同义词发现
[目的]借鉴Lesk词义消歧思想,提出并实现一种利用术语定义来发现汉语同义词的方法.[方法]将新能源汽车领域汉语科技词系统中的术语及其定义作为测试集,首先对术语定义做分词和词性标注,并进行人工校对,然后抽取出动词和名词词性的实词,再根据两个术语定义中相同的实词数量及位置信息计算术语的相似度,最后根据相似度和给定的阈值得到同义词关系的推荐.[结果]利用准确率、召回率、F值对同义词发现效果进行评价,论证该方法的有效性,结果表明该方法可以达到较高的准确率,但是召回率比较低.[局限]该同义词发现方法不能剔除反义关系和相关关系的术语对,造成召回率较低.[结论]该方法较为简便快捷有效,并且可达到较高准确率,但召回率有待提高.
术语定义、相似度算法、同义词发现、实词、出现位置
G254;TP391(图书馆学、图书馆事业)
国家自然科学基金项目“面向特定情报分析应用的知识组织系统快速构建关键问题研究”71203208;国家“十二五”科技支撑计划课题“面向外文科技文献信息的超级科技词表和本体建设”2011BAH10B01;中国科学技术信息研究所重点工作项目“汉语科技词系统建设与应用工程”项目ZD2012-3-2的研究成果之一
2014-05-22(万方平台首次上网日期,不代表论文的发表时间)
共7页
41-47