10.13266/j.issn.0252-3116.2015.12.019
一种基于有向图的同义词抽取结果排序方法
[目的/意义]鉴于目前同义词抽取方法无法避免抽取结果含有较多的噪音,需要较高的人工代价去除噪音,提出一种对同义词抽取结果排序的方法,使得正确结果排序提前,以达到提高抽取结果准确性及降低人工去噪代价的目的.[方法/过程]将抽取结果转化为抽取关系有向图,基于该有向图计算抽取结果中每个词汇与被抽取词汇的词义相似性,并按照词义相似性高低进行排序.排序方法的最大特点是只利用了当前的同义词抽取方法,不需要人工参与和额外的语义知识.[结果/结论]通过在真实数据集上进行验证,得出排序效果与抽取结果的规模呈正向关系的论点,即一个给定词汇的同义词抽取结果数量越多,排序的效果就会越好.
同义词、信息抽取、噪音清洗、结果排序
G250(图书馆学、图书馆事业)
本文系国家自然科学基金项目“基于海量数字资源的科研关系网络构建研究”项目编号:71273251研究成果之一.
2015-09-18(万方平台首次上网日期,不代表论文的发表时间)
128-134