10.3778/j.issn.1002-8331.1109-0145
基于改进SMOTE的非平衡数据集分类研究
针对SMOTE(Synthetic Minority Over-sampling Technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法(SSMOTE).该算法的关键是将支持度概念和轮盘赌选择技术引入到SMOTE中,并充分利用了异类近邻的分布信息,实现了对少数类样本合成质量和数量的精细控制.将SSMOTE与KNN(K-Nearest Neighbor)算法结合来处理不平衡数据集的分类问题.通过在UCI数据集上与其他重要文献中的相关算法进行的大量对比实验表明,SSMOTE在新样本的整体合成效果上表现出色,有效提高了KNN在非平衡数据集上的分类性能.
非平衡数据集、分类、支持度、轮盘赌选择、合成少数过采样技术(SMOTE)
49
TP181(自动化基础理论)
国家自然科学基金31170393;陕西省教育厅自然科学项目2010JK620
2013-03-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
184-187,245