语料对齐工具的性能比较与选择
本文利用实验研究的方法,以文学、财经和科技三种文体为样本,对6款常见的语料对齐工具进行了比较研究.研究发现:(1)除Déjà Vu X3之外,相同文本使用docx和txt格式对对齐结果没有影响;(2)Transmate、ABBYY Aligner 2.0和memoQ 2015的对齐准确率位居前列,表现稳定;(3)使用不同体裁的文本,对齐质量也会不同.科技文本的对齐效果最佳,其次是财经和文学;(4)对齐准确率是评测对齐质量的主要指标,但不是唯一指标;(5)距离完美对齐的距离、句段长短、标签数量也影响对齐质量.本文还提出了对齐准确率的概念和计算公式.本研究对对齐工具的选择和改进具有一定参考作用.
语料、对齐、对齐准确率
40
H059(写作学与修辞学)
2019-06-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
150-155