汉语词性标注排歧方法探讨

引用

摘要：

该文将概率统计的二元模型与三元模型用于汉语词性自动标注，在算法为线性阶的时间复杂度的情况下，对20万训练集和1万的测试集，分别进行封闲测试和开放测试，对稀疏矩阵零元素及词性标注的结果做了统计分析。

关键词：词性标注同现概率矩阵语料库统计模型

所属期刊栏目：37

分类号：TP391.12(计算技术、计算机技术)

资助基金：国家自然科学基金69575011;国家高技术研究发展计划863计划863-306-ZT03-03-1;山西省自然科学基金991035;山西省留学回国人员科研项目;山西省青年科研项目991002

在线出版日期：2004-01-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：70-72

英文信息展示

期刊专题