10.3778/j.issn.1002-8331.2010.36.040
改进的HMM应用于哈萨克语词性标注
哈萨克语的词性标注在自然语言信息处理领域中扮演着重要角色,是句法分析、信息抽取、机器翻译等自然语言处理的基础.在传统的HMM的基础上改进了HMM模型参数的计算、数据平滑以及未登录词的处理方法,使之更好地体现词语的上下文依赖关系.利用基于统计的方法对哈萨克语熟语料进行训练,然后用Viterbi算法实现词性标注.实验结果表明利用改进的HMM进行词性标注的效果比传统的HMM好.
隐马尔科夫模型、哈萨克语、词性标注
46
TP391.1(计算技术、计算机技术)
国家自然科学基金the National Natural Science Foundation of China under Grant 60763005;国家教育部、国家语委民族语盲文字规范标准建设及信息化科研项目MZ115-92
2011-03-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
147-149