10.3321/j.issn:0254-4164.2001.01.008
基于支持向量机与无监督聚类相结合的中文网页分类器
提出了一种将支持向量机与无监督聚类相结合的新分类算法,给出了一种新的网页表示方法并应用于网页分类问题.该算法首先利用无监督聚类分别对训练集中正例和反例聚类,然后挑选一些例子训练SVM并获得SVM分类器.任何网页可以通过比较其与聚类中心的距离决定采用无监督聚类方法或SVM分类器进行分类.该算法充分利用了SVM准确率高与无监督聚类速度快的优点.实验表明它不仅具有较高的训练效率,而且有很高的精确度.
支持向量机、聚类、网页分类
24
TP391(计算技术、计算机技术)
国家自然科学基金69803010;国家高技术研究发展计划863计划863-511-946-010
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
62-68