10.3969/j.issn.1006-2475.2015.03.009
基于累积正样本的偏斜数据流集成分类方法
针对现有处理偏斜数据流的方法存在过拟合或者未充分利用现有数据这一问题,提出一种基于累积正样本的偏斜数据流集成分类方法EAMIDS。该算法把目前达到的所有数据块的正样本收集起来生成集合AP,然后采用KNN算法和Over-sampling方法来平衡数据块的类分布。当基分类器数量超过最大值时,根据F-Measure值来更新集成分类器。通过在模拟数据集SEA和SPH上的实验,与IDSL算法和SMOTE算法相比,表明EAMIDS具有更高的准确率。
偏斜数据流、累积正样本、集成分类器、概念漂移
TP391(计算技术、计算机技术)
西北工业大学基础研究基金资助项目JC201273
2015-04-10(万方平台首次上网日期,不代表论文的发表时间)
共7页
41-47