10.3969/j.issn.2095-2163.2012.01.002
基于统计的日本人名的识别和翻译
采用基于统计的方法实现日本人名的识别和翻译系统.将人名的识别转换成序列标注问题,采用条件随机场方法训练识别模型.训练语料在标注时使用S/E(Start/End)标注风格;利用人名在上下文中的关系、人名称呼后缀词和人名字典来设计特征模板.人名翻译时将日本人名分为假名人名和汉字人名,汉字人名的翻译通过建立日本人名常用汉字翻译字典实现;假名人名的翻译通过Moses系统训练翻译模型实现.该系统在人名的识别和翻译测试中都取得了不错统计结果.
人名识别、条件随机场、人名汉字翻译字典
2
TPP391.2
2012-06-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
4-7