10.3778/j.issn.1002-8331.2010.01.039
一种基于预分类的高效SVM中文网页分类器
中文网页分类技术是数据挖掘研究中的一个热点领域,而支持向量机(SVM)是一种高效的分类识别方法.首先给出了一个基于SVM的中文网页自动分类系统模型,详细介绍了分类过程中涉及的一些关键技术,其中包括网页预处理、特征选择和特征权重计算等.提出了一种利用预置关键词表进行预分类的方法,并详细说明了该方法的原理与实现.实验结果表明,该方法与单独使用SVM分类器相比,不仅大大减少了分类时间,准确率和召回率也明显提高.
支持向量机、中文网页分类、文本分类、机器学习
46
TP391.1(计算技术、计算机技术)
2010-03-29(万方平台首次上网日期,不代表论文的发表时间)
共4页
125-128