10.11896/j.issn.1002-137X.2017.08.038
基于邻域混合抽样和动态集成的不平衡数据分类方法
不平衡数据严重影响了传统分类算法的性能,导致少数类的识别率降低.提出一种基于邻域特征的混合抽样技术,该技术根据样本邻域中的类别分布特征来确定采样权重,进而采用混合抽样的方法来获得平衡的数据集;然后采用一种基于局部置信度的动态集成方法,通过分类学习生成基分类器,对于每个检验的样本,根据局部分类精度动态地选择最优的基分类器进行组合.通过UCI标准数据集上的实验表明,该方法能够同时提高不平衡数据中少数类和多数类的分类精度.
数据挖掘、不平衡数据、K-近邻、混合抽样、集成学习
44
TP391(计算技术、计算机技术)
2017-10-11(万方平台首次上网日期,不代表论文的发表时间)
共5页
225-229