期刊专题

10.3772/j.issn.2095-915x.2017.03.009

深度学习在统计机器翻译领域自适应中的应用研究

引用
统计机器翻译往往存在待翻译文本来源多样和领域不一致的问题.为了提升面向不同领域的文本的翻译质量,需要根据待翻译文本对训练语料进行筛选以达到领域自适应的目的.目前统计机器翻译的领域自适应方法以目标数据为基准,着重利用统计技术对训练数据或者翻译模型进行领域的适应调整,缺乏明确的领域标签.本研究在本组之前研究基础上利用深度学习中卷积神经网络(Convolutional neural network,CNN)对短文本进行建模,构建合适的网络结构进行有监督学习,获取完整的句子语义信息,按照待翻译文本的领域信息对训练语料进行归类筛选,获取与待翻译文本领域一致的训练数据,并将其应用到统计机器翻译中.本文采用万方英文摘要在统计机器翻译系统上进行测试,仅利用部分训练数据就得到了超越原始训练数据BLEU打分的翻译结果,证明了本研究的有效性和可行性.

统计机器翻译、训练语料选取、卷积神经网络、深度学习

3

G35;TP391.41(情报学、情报工作)

国家自然科学基金项目61303152、71503240和71403257;中国科学技术信息研究所重点工作项目ZD2017-4

2017-08-04(万方平台首次上网日期,不代表论文的发表时间)

共13页

64-76

暂无封面信息
查看本期封面目录

情报工程

2095-915X

10-1263/G3

3

2017,3(3)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn