10.3969/j.issn.1006-2475.2018.03.016
改进Smote算法在不平衡数据集上的分类研究
在不平衡数据集中,过抽样算法如Smote(Synthetic Minority Oversampling)算法、R-Smote算法与SD-ISmote算法可能会模糊多数类与少数类的边界以及使用噪声数据合成新样本.本文提出的ImprovedSmote 算法使用少数数据集的簇心与其对应类别的少数集数据,在簇心与不大于样本属性数的对应类别少数集数据形成的图形内随机插值来生成新数据.ImprovedSmote算法结合C4.5决策树与神经网络算法在实验数据集上的结果比Smote, R-Smote与SD-ISmote算法更好,可以有效地提高分类器分类性能.
不平衡数据集、Smote算法、R-Smote算法、SD-ISmote算法、ImprovedSmote算法、簇心
TP301.6(计算技术、计算机技术)
国家粮食公益性行业科研专项项目201513004-6;"十二五"农村领域国家科技计划子课题2015BAD17B02-8;现代农业产业技术体系专项资金项目CARS-49;江苏省产学研合作项目BY2015019-30
2018-04-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
83-88