10.3321/j.issn:1002-0470.2003.05.004
基于双语语料库的翻译等价对自动抽取
提出了一种利用双语语料库自动抽取多词翻译等价对的方法.首先利用N-gram模型获得候选翻译单元,然后根据统计同现计算候选等价对的翻译概率,并用贪心策略实现翻译等价对的自动抽取.在翻译概率的计算中对3种常用的统计同现测度进行了比较.实验表明,当语料规模较小时,对数似然比(Log Likelihood Ratio)测度对于翻译等价对的抽取具有较好的效果.与现有方法相比,该方法较好地解决了翻译等价对抽取中多词单元对应及间接相关问题.
双语语料库、翻译等价对、N-gram、知识获取
13
TP3(计算技术、计算机技术)
国家高技术研究发展计划863计划2001AA114101
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
19-24