期刊专题

10.3778/j.issn.1002-8331.2011.01.038

一种基于过抽样技术的非平衡数据集分类方法

引用
非平衡数据集的分类问题是机器学习领域的一个研究热点.针对非平衡数据集分类困难的问题,特别是由于非平衡分布引起的少数类识别能力低下的问题,提出了一种改进算法,AdaBoost-SVM-OBMS.该算法结合Boosting算法和基于错分样本产生新样本的过抽样技术.在新算法中,以支持向量机为元分类器,每次Boosting迭代中标记出错分的样本点,然后在错分样本点与其近邻间随机产生一定数量与错分样本同一类别的新样本点.新产生样本点加入原训练集中重新训练学习,以提高分类困难样本的识别能力.在AUC,F-value和G-mean 3个不同价格的评价指标下8个benchmark数据集上对AdaBoost-SVM-OBMS算法与AdaBoost-SVM算法和APLSC算法进行了对比实验,实验结果表明了AdaBoost-SVM-OBMS算法在非平衡数据集分类中的有效性.

数据挖掘、非平衡数据集、Boosting、错分样本、支持向量机

47

TP181(自动化基础理论)

国家高技术研究发展计划863the National High-Tech Research and Development Plan of China under Grant 2008AA042902,2009AA04Z162;高等学校学科创新引智111计划资助the 111 Project under Grant B07031

2011-05-30(万方平台首次上网日期,不代表论文的发表时间)

共5页

139-143

暂无封面信息
查看本期封面目录

计算机工程与应用

1002-8331

11-2127/TP

47

2011,47(1)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn