10.3969/j.issn.1002-137X.2013.06.049
基于正则化互信息和差异度的集成特征选择
如何构造差异性大的基分类器是集成学习研究的重点,为此提出迭代循环选择法:以最大化正则互信息为准则提取最优特征子集,进而基于此训练得到基分类器;同时以错分样本个数作为差异性度量准则来评价所得基分类器的性能,若满足条件则停止,反之则循环迭代直至结束.最后用加权投票法融合所选基分类器的识别结果.通过仿真实验验证算法的有效性,以支持向量机为分类器,在公共数据集UCI上进行实验,并与单SVM及经典的Bagging集成算法和特征Bagging集成算法进行对比.实验结果显示,该方法可获得较高的分类精度.
集成学习、集成特征选择、互信息、差异性
40
TP391(计算技术、计算机技术)
国家自然科学基金项目60975026,61273275
2013-07-10(万方平台首次上网日期,不代表论文的发表时间)
共4页
225-228