10.13657/j.cnki.gxkxyxb.20221209.009
基于关系模式与深度强化学习的DS数据去噪模型
远程监督(Distant Spervision,DS)数据集中存在大量错误标注的数据,而现有的DS数据集去噪方法通常只考虑针对具有标签的数据进行去噪,没有充分利用无标签数据,导致去噪效果不佳.本文提出一种新型DS数据去噪模型——Pattern Reinforcement Learning Model(PRL模型):首先利用基于关系模式的正样例抽取算法提取DS数据集中高质量的有标签数据;然后利用Filter-net作为分类器,提取DS数据集中高质量的无标签数据;最后将高质量的有标签数据和无标签数据作为深度强化学习(Reinforcement Learning,RL)方法的训练数据集,获得去噪效果更好的远程监督数据集.将PRL模型应用于New York Times(NYT)数据集,并以去噪后的数据集来训练PCNN+ONE、CNN+ATT、PCNN+ATT 3个模型.实验结果表明,经过PRL模型对数据集进行去噪后,这些模型的性能得以提升.因此,PRL模型是一种轻量的数据去噪模型,可以提升基于深度神经网络模型的性能.
自然语言处理、关系分类、远程监督、迁移学习、去噪方法
38
TP31(计算技术、计算机技术)
国家自然科学基金;广西高校中青年教师科研基础能力提升项目
2023-01-09(万方平台首次上网日期,不代表论文的发表时间)
共9页
403-411