10.3321/j.issn:1002-0470.2001.03.007
无需词典支持和切词处理的中文文档分类
利用中文文本的N-gram信息进行中文文档分类,使中文文档分类摆脱了 对词典和切词处理的依赖。实验结果表明,该方法能够取得令人满意的分类效果。
中文文档分类、N-gram信息、属性选择、贝叶斯分类、kNN 法
11
TP39(计算技术、计算机技术)
国家高技术研究发展计划863计划863-306-ZT04-02-2
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
31-35