DOI：10.3778/j.issn.1002-8331.2010.36.040

改进的HMM应用于哈萨克语词性标注

引用

摘要：

哈萨克语的词性标注在自然语言信息处理领域中扮演着重要角色,是句法分析、信息抽取、机器翻译等自然语言处理的基础.在传统的HMM的基础上改进了HMM模型参数的计算、数据平滑以及未登录词的处理方法,使之更好地体现词语的上下文依赖关系.利用基于统计的方法对哈萨克语熟语料进行训练,然后用Viterbi算法实现词性标注.实验结果表明利用改进的HMM进行词性标注的效果比传统的HMM好.

关键词：隐马尔科夫模型、哈萨克语、词性标注

所属期刊栏目：46

分类号：TP391.1(计算技术、计算机技术)

资助基金：国家自然科学基金the National Natural Science Foundation of China under Grant 60763005;国家教育部、国家语委民族语盲文字规范标准建设及信息化科研项目MZ115-92

在线出版日期：2011-03-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：147-149

英文信息展示

期刊专题