10.3969/j.issn.1009-3044.2009.19.002
基于英汉平行语料库术语词典的自动抽取
该文提出了一种从英汉平行语料库中自动抽取术语词典的算法.采用的是已对齐好的双语语料,中文经过了分词处理.利用英文和中文词性标注工具对英文语料和中文语料分辨进行词性标注.统计双语语料库中的名词和名词短语生成候选术集.然后对每个英文候选术语计算与其相关的中文翻译问的翻译概率.再通过设定阈值过滤掉一些与该英文候选词无关的中文翻译,最后通过贪心算法选取概率最大的词作为该英文候选词的中文翻译.
术语抽取、平行语料、句子对齐、翻译概率
5
TP391(计算技术、计算机技术)
2009-09-02(万方平台首次上网日期,不代表论文的发表时间)
共3页
5081-5083