10.3778/j.issn.1002-8331.2107-0097
不平衡数据集分类方法综述
不平衡数据集的特点导致了在分类时产生了诸多难题.对不平衡数据集的分类方法进行了分析与总结.在数据采样方法中从欠采样、过采样和混合采样三方面介绍不平衡数据集的分类方法;在欠采样方法中分为基于K近邻、Bagging和Boosting三种方法;在过采样方法中从合成少数过采样技术(Synthetic Minority Over-sampling Technology,SMOTE)、支持向量机(Support Vector Machine,SVM)两个角度来分析不平衡数据集的分类方法;对这两类采样方法的优缺点进行了比较,在相同数据集下比较算法的性能并进行分析与总结.从深度学习、极限学习机、代价敏感和特征选择四方面对不平衡数据集的分类方法进行了归纳.最后对下一步工作方向进行了展望.
不平衡数据集;分类;采样方法;K近邻(KNN);合成少数过采样技术(SMOTE);深度学习
57
TP391(计算技术、计算机技术)
国家自然科学基金;宁夏自然科学基金;北方民族大学研究生创新项目
2021-11-26(万方平台首次上网日期,不代表论文的发表时间)
共11页
42-52