10.3969/j.issn.1671-1815.2007.21.024
基于数据分割和近邻对的快速SVM分类算法
大样本的学习是支持向量机领域中的一个重要课题.基于数据分割和邻近对策略,提出了一种新的支持向量机分类算法.在新的算法中,首先利用c-均值聚类分别对数据集中的正负类进行聚类,把大数据集分割成互不相交的子集合;然后来自正负类的子集合两两组合形成多个二分类问题,并用SMO算法求解;最后用邻近对策略对未知数据进行识别.为了验证新算法的有效性,把它应用于5个UCI数据集,并和SMO算法做了比较.结果表明:新算法不仅大大地减少了大样本学习的训练时间,而且相应的测试精度几乎没有降低.
支持向量机、c-均值聚类、数据分割、邻近对策略
7
TP311.12(计算技术、计算机技术)
广东省自然科学基金04020079;吉林大学符号计算与知识工程教育部重点实验室开放课题93K-17-2006-03;华南理工大学校科研和教改项目B13-E5050190
2008-04-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
5563-5566