10.3772/j.issn.1002-0470.2009.04.002
基于短语相似度的统计机器翻译模型
针对基于短语的统计机器翻译(SMT)模型中由于采用精确匹配策略导致的短语稀疏问题,提出了一种基于短语相似度的统计机器翻译模型.该模型将基于实例的翻译方法引入到统计机器翻译中.翻译时,对于训练语料库中未出现过的短语,通过计算源语言短语之间的相似度,采用模糊匹配策略从短语表中查找相似的实例短语,并根据实例短语为其构造翻译.与精确匹配策略相比,利用相似度进行模糊匹配增加了对短语表的利用程度,缓解了短语稀疏问题.实验表明,该模型能够明显地提高统计机器翻译的质量,效果超过了当前最好的短语系统"摩西(Moses)".
相似度、基于短语的统计机器翻译、基于实例的机器翻译
19
TP3;H08
863计划2006AA010108;国家自然科学基金60573188,60603095,60736014
2009-06-24(万方平台首次上网日期,不代表论文的发表时间)
共5页
337-341