10.3969/j.issn.2095-2163.2013.04.003
统计机器翻译中双语语料的过滤及词对齐的改进
词对齐是统计机器翻译系统中最重要的一个环节,统计机器翻译中的翻译模型和调序模型都是在词对齐结果的基础上构造的,词对齐阶段出现的错误,会延续到这些模型中,甚至会因为词对齐的错误而在这些模型中引发更大的错误.为减少词对齐阶段的错误,提出一种基于对齐困惑度的双语语料过滤方法和一种改进的判别式词对齐算法,语料过滤方法可以将词对齐阶段有严重错误的双语句对过滤掉,判别式词对齐算法与传统的自动词对齐算法相比,可以得到对齐错误率更低的词对齐结果.
词对齐、统计机器翻译、对齐困惑度、对齐错误率
3
TP391(计算技术、计算机技术)
国家自然科学基金重点项目61173073;国家高技术研究发展计划863重点项目2011AA01A207
2013-11-29(万方平台首次上网日期,不代表论文的发表时间)
共5页
10-13,17