10.11896/j.issn.1002-137X.2015.9.048
基于RSBoost算法的不平衡数据分类方法
不平衡数据的分类问题在多个应用领域中普遍存在,已成为数据挖掘和机器学习领域的研究热点.提出了一种新的不平衡数据分类方法RSBoost,以解决传统分类方法对于少数类识别率不高和分类效率低的问题.该方法采用SMOTE方法对少数类进行过采样处理,然后对整个数据集进行随机欠采样处理,以改善整个数据集的不平衡性,再将其与Boosting算法相结合来对数据进行分类.通过实验对比了5种方法在多个公共数据集上的分类效果和分类效率,结果表明该方法具有较高的分类识别率和分类效率.
不平衡数据、组合数据采样、Boosting、RSBoost
42
TP301.6(计算技术、计算机技术)
山东省自然科学基金ZR2013FL034
2015-10-12(万方平台首次上网日期,不代表论文的发表时间)
共5页
249-252,267