10.3778/j.issn.1002-8331.1906-0441
整合DBSCAN和改进SMOTE的过采样算法
针对SMOTE(Synthetic Minority Over-sampling Technique)等传统过采样算法存在的忽略类内不平衡、扩展少数类的分类区域以及合成的新样本高度相似等问题,基于综合考虑类内不平衡和合成样本多样性的思想,提出了一种整合DBSCAN和改进SMOTE的过采样算法DB-MCSMOTE(DBSCAN and Midpoint Centroid Synthetic Minority Over-sampling Technique).该算法对少数类样本进行DBSCAN聚类,根据提出的簇密度分布函数,计算各个簇的簇密度和采样权重,在各个簇中利用改进的SMOTE算法(MCSMOTE)在相距较远的少数类样本点之间的连线上进行过采样,提高合成样本的多样性,得到新的类间和类内综合平衡数据集.通过对一个二维合成数据集和九个UCI数据集的实验表明,DB-MCSMOTE可以有效提高分类器对少数类样本和整体数据集的分类性能.
过采样、类内不平衡、少数类、多样性、SMOTE算法、DBSCAN算法
56
TP391(计算技术、计算机技术)
国家自然科学基金;中央高校基本科研基金
2020-09-17(万方平台首次上网日期,不代表论文的发表时间)
共8页
111-118