10.3321/j.issn:1002-8331.2001.07.023
汉语词性标注排歧方法探讨
该文将概率统计的二元模型与三元模型用于汉语词性自动标注,在算法为线性阶的时间复杂度的情况下,对20万训练集和1万的测试集,分别进行封闲测试和开放测试,对稀疏矩阵零元素及词性标注的结果做了统计分析。
词性标注同现概率矩阵语料库统计模型
37
TP391.12(计算技术、计算机技术)
国家自然科学基金69575011;国家高技术研究发展计划863计划863-306-ZT03-03-1;山西省自然科学基金991035;山西省留学回国人员科研项目;山西省青年科研项目991002
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
70-72