10.3969/j.issn.1671-1815.2012.10.018
基于既定词表的彝文自动分词技术研究
自动分词是彝文信息处理中一项不可缺少的基础性工作,彝文信息处理只要涉及到检索、翻译、校对等,就需要以词为基本单位.根据彝文的特点,介绍了彝文分词规范与分词词表的设计,提出了实现基于既定词表的彝文自动分词技术的算法选择、系统结构,以及实现流程;而且进行了抽样测试,其分词准确率和速度都比较令人满意.最后结合彝文的特点对实现彝文自动分词的难点进行了分析.
彝文、自动分词、算法、测试评价、难点分析
12
TP391.43(计算技术、计算机技术)
国家民委科研项目09XN07;国家外专项目Y-2010-26
2012-07-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
2328-2332