DOI：10.3772/j.issn.2095-915x.2023.02.009

多引擎机器翻译译文重排序与融合研究

引用

摘要：

[目的/意义]使用不用的模型、方法、语种、数据构建的机器翻译引擎往往在不同的场景下具有不同的翻译效果.因此,很多研究者都在构建机器翻译引擎时尝试使用多引擎译文融合或多翻译方法融合的方式来利用不同翻译引擎的优点,然而过往的工作没有考虑到如何利用用户在使用多引擎机器翻译所产生的数据来获取存在于用户认知域中对这些引擎译文的评价.[方法/过程]本文研究提出了基于六个翻译引擎的多引擎翻译平台.该平台在长期使用中产生了翻译结果、用户特征、人工校译等数据,本文基于以上大规模历史数据构建了翻译模型训练资源库,结合Page Rank算法、贝叶斯公式和UNQE方法提出了多引擎机器翻译译文重排序方法,并利用译文重排序的结果与翻译模型训练资源库中的翻译实例相关数据,进一步使用Transformer架构训练了译文融合模型.[局限]所提方法存在冷启动问题,需要一定时间、大量用户的真实数据才能够实现预期效果.[结果/结论]实验结果表明了本文提出的方法能够融合多引擎优势,提高不同领域的平均译文质量.

关键词：多引擎机器翻译、译文重排序、译文融合

所属期刊栏目：9

分类号：TP391;G35(计算技术、计算机技术)

在线出版日期：2023-06-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共12页

页码：96-107

英文信息展示

期刊专题