10.3321/j.issn:0254-4164.2000.02.008
基于k-近似的汉语词类自动判定
生词处理在面向大规模真实文本的自然语言处理各项应用中占有重要位置. 词类自动判定就是对词类未知的生词由机器自动赋予一个合适的词类标记.文中提出了一种基于k-近似的词类自动判定算法,并在一个1亿字汉语语料库及一个60万字经过人工分词和词类标注的汉语熟语料库的支持下,构造了相应实验. 实验结果初步显示,本算法对汉语开放词类--名词、动词、形容词的词类自动判定平均正确率分别为99.21%、84.73%、70.67%,基本上能够满足工程实现的需要.
词类自动判定、生词处理、中文信息处理、自然语言处理、人工智能
23
TP391(计算技术、计算机技术)
中国科学院资助项目69705005
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
166-170