期刊专题

同义词抽取结果的噪音清洗方法研究

引用
[目的]同义词抽取结果中的噪音会严重影响结果的可应用性,需要预先进行清洗.[方法]提出一种基于同义关系网络的噪音清洗方法,将同义词抽取结果转化为无向结构的同义关系网络,在该网络中自动识别出同义词抽取结果中部分噪音,并结合语义的分布相似性对方法进行改进,以提高噪音的识别比例.[结果]通过在工程技术领域随机选取的术语上进行实验,表明该方法可以过滤同义词抽取结果中32.6%-73.0%的噪音.[局限]只能清除部分噪音,还需要改进方法以提高噪音识别的准确性.[结论]通过构建同义关系网络能够清洗同义词抽取结果中的噪音,该问题值得进一步深入研究.

同义词、信息抽取、噪音清洗、同义关系网络

TP18(自动化基础理论)

本文系国家“十二五”科技支撑计划资助项目“《汉语主题词表》工程技术版与英文超级科技词表的映射研究”项目编号:2011BAH10B07的研究成果之一.

2015-06-29(万方平台首次上网日期,不代表论文的发表时间)

64-70

暂无封面信息
查看本期封面目录

现代图书情报技术

1003-3513

11-2856/G2

2015,(6)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn