基于新型不纯度度量的代价敏感随机森林分类器
针对不平衡数据集的有效分类问题,提出一种结合代价敏感学习和随机森林算法的分类器.首先提出了一种新型不纯度度量,该度量不仅考虑了决策树的总代价,还考虑了同一节点对于不同样本的代价差异;其次,执行随机森林算法,对数据集作K次抽样,构建K个基础分类器;然后,基于提出的不纯度度量,通过分类回归树(CART)算法来构建决策树,从而形成决策树森林;最后,随机森林通过投票机制做出数据分类决策.在UCI数据库上进行实验,与传统随机森林和现有的代价敏感随机森林分类器相比,该分类器在分类精度、AUC面积和Kappa系数这3种性能度量上都具有良好的表现.
代价敏感学习、随机森林、不纯度度量、分类回归树(CART)、不平衡数据
44
TP181(自动化基础理论)
2018-01-24(万方平台首次上网日期,不代表论文的发表时间)
共4页
98-101