期刊专题

10.13803/j.cnki.issn1009-9743.2019.02.006

浅议多种重映射融合的汉英词对齐法

引用
针对自动词对齐工具Giza++只允许源语言到目标语言的一对多映射,并生成了很多不对称的对齐,进而直接影响到词对齐的质量和准确性这一缺陷,文章通过研究发现,基于不同预处理机制的词对齐有着不同的系统上可见优势,相对于采用单一预处理机制,机器学习算法可以从基于多预处理机制的词对齐信息中获益.在此基础上,提出基于多预处理机制的多种重映射融合词对齐方法这一设想,并通过实验验证:通过分词预处理形成尽可能含有正确分词方案的方案集,通过对齐预处理获得尽可能多的可靠对齐点,并通过对齐重映射实现对齐的对称化,随后,将对齐重映射的所有相关特征训练一个对齐融合模型,并将这个对齐融合模型作为监督系统,以显著增加词对齐的准确性.

汉英词对齐、Giza++工具、多预处理机制、重映射融合

20

H315.9(英语)

2016年海南省自然科学基金项目“基于多预处理机制的多种重映射融合汉英自动词对齐系统研究—以海南旅游文本汉英翻译网上平行语料库创建为例”编号:20167238成果之一.2016年海南省哲学社会科学规划课题“海南城市外宣翻译的跨文化文本重构研究”编号:HNSKQN16-134

2019-07-31(万方平台首次上网日期,不代表论文的发表时间)

共5页

29-33

暂无封面信息
查看本期封面目录

海南广播电视大学学报

1009-9743

46-1061/G4

20

2019,20(2)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn