融入新能源领域术语知识的机器翻译方法
在领域机器翻译中,领域术语能否被正确翻译对翻译质量起着决定性作用,有效地将领域术语融入到神经机器翻译模型中,提升领域术语的翻译质量具有实际意义.文中提出了一种将新能源领域术语信息作为先验知识融入神经机器翻译中的方法,以新能源领域双语术语知识库构建的术语字典为媒介,提出并比较了两种不同的知识融入方式:1)术语替换,即在源语言端使用目标端术语替换源端术语;2)术语添加,即在源语言端将源端术语与目标端术语拼接,并在源语言端与目标语言端均使用作为特殊外部知识的标识符来标识目标端术语的开头与结尾.以新能源领域中英文双语对齐语料以及构建的中英文对齐术语库为数据基础进行了实验,结果表明,在测试集上,所提方法的BLEU值比基线实验分别高出6.38与6.55,证明了所提方法能有效地将领域术语知识融入到翻译模型中,提升了领域术语的翻译质量.
领域机器翻译、领域术语、特殊标识、先验知识、术语替换、术语添加
49
TP391(计算技术、计算机技术)
北京市自然科学基金;国家自然科学基金;北京信息科技大学勤信人才培育计划项目;北京市市教委科研计划
2022-06-24(万方平台首次上网日期,不代表论文的发表时间)
共8页
305-312