10.3778/j.issn.1002-8331.2011.28.039
用于不均衡数据集分类的KNN算法
针对KNN在处理不均衡数椐集时,少数类分类精度不高的问题,提出了一种改进的算法G-KNN.该算法对少数类样本使用交叉算子和变异算子生成部分新的少数类样本,若新生成的少数类样本到父代样本的欧几里德距离小于父代少数类之间的最大距离,则认为是有效样本,并把这类样本加入到下轮产生少数类的过程中.在UCI数据集上进行测试,实验结果表明,该方法与KNN算法中应用随机抽样相比,在提高少数类的分类精度方面取得了较好的效果.
不均衡数据集、K最近邻居(KNN)算法、过抽样、交叉算子
47
TP391(计算技术、计算机技术)
山东省自然科学基金ZR201 0FM021;山东省科技研究计划项目2007ZZ17,2008GG 10001015,2008B0026;山东省教育厅科研项目J09LG02
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
143-145,236