10.3969/j.issn.1672-0962.2014.02.018
汉英机器翻译中“的”的二义性消除
汉语连接结构中的“的(DE)”无处不在,并且可以以多种不同的方式翻译成英语。即使使用语法敏感的翻译模型,其仍然是机器翻译产生偏差的一个主要原因。如何根据语篇语境中的“的(DE)”获得句法、语义的更多信息,从而催生出适当的英语翻译策略?实验描述了汉语NPs中“的(DE)”的分类,构造带注释的实例语料库,然后将其训练成包含语言启发功能的分类器。通过显式标签“的(DE)”结构,使用DE分类器对机器翻译数据进行预处理及重排短语,结果表明此方法为措辞系统提供了显著的MT02(使用 BLEU及其翻译软件系统)收益(+1.31),MT03(+0.92)和 MT05(+1.57),当翻译模型的应用层次经过如此重新排序后其准确性得到持续提升。
“的”、机器翻译、二义性、消除
H085(应用语言学)
2014-06-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
81-86