10.3969/j.issn.1006-2475.2021.09.017
S2R2:基于相关性与冗余性分析的半监督特征选择
特征选择是模式识别与数据挖掘的关键问题之一,它可以移除数据集中的冗余和不相关特征以提升学习性能.基于最大相关最小冗余准则,提出一种新的基于相关性与冗余性分析的半监督特征选择方法(S2R2),S2R2方法独立于任何分类学习算法.该方法首先对无监督相关度信息度量进行分析与扩充,然后结合信息增益,设计一种半监督特征相关性与冗余性度量,可以有效识别与移除不相关和冗余特征,最后采用增量搜索技术贪婪地构建特征子集,避免搜索指数级大小的解空间,提高算法的运行效率.本文还提出S2R2方法的快速过滤版本,FS2R2,以更好地应对大规模特征选择问题.多个标准数据集上的实验结果表明了所提方法的有效性和优越性.
半监督学习、特征选择、信息论、最大相关最小冗余
TP391(计算技术、计算机技术)
国家自然科学基金资助项目;中央高校基本科研业务费专项资金资助项目
2021-09-22(万方平台首次上网日期,不代表论文的发表时间)
共9页
113-120,126