基于最大信息系数和近似马尔科夫毯的特征选择方法
最大信息系数(Maximum information coefficient,MIC)可以对变量间的线性和非线性关系,以及非函数依赖关系进行有效度量.本文首先根据最大信息系数理论,提出了一种评价各维特征间以及每维特征与类别间相关性的度量标准,然后提出了基于新度量标准的近似马尔科夫毯特征选择方法,删除冗余特征.在此基础上提出了基于特征排序和近似马尔科夫毯的两阶段特征选择方法,分别对特征的相关性和冗余性进行分析,选择有效的特征子集.在UCI和ASU上的多个公开数据集上的对比实验表明,本文提出的方法总体优于快速相关滤波(Fast correlation-based filter,FCBF)方法,与ReliefF,FAST,Lasso和RFS方法相比也具有优势.
特征选择、最大信息系数、近似马尔科夫毯、特征相关性、特征冗余性
43
TP3;U66
国家自然科学基金60903083, 61502123;黑龙江省新世纪人才项目1155-ncet-008 资助 Supported by National Natural Science Foundation of China60903083, 61502123;Research Fund for the Program of New Century Excellent Talents in Heilongjiang Provincial Uni-versity1155-ncet-008
2017-06-27(万方平台首次上网日期,不代表论文的发表时间)
共11页
795-805