10.3969/j.issn.1674-3644.2019.03.010
一种改进的主成分分析特征抽取算法:YJ-MICPCA
针对主成分分析(PCA)假设数据服从高斯分布的条件以及只能处理特征之间线性关系的不足,提出一种基于Yeo-Johnson变换和最大信息系数(MIC)的PCA特征抽取算法,命名为YJ-MICPCA.通过Yeo-Johnson变换改善原始数据分布,使其近似服从高斯分布,并将PCA中计算协方差矩阵转化为计算MIC矩阵的平方,使其也能处理特征间存在的非线性关系.以UCI机器学习数据库中的11个数据集为实验对象,采用支持向量机、朴素贝叶斯模型、k近邻算法这3种分类器,比较了YJ-MICPCA与PCA及其他常用非线性降维方法LLE、Isomap、MSD、KPCA的降维效果和分类精度,结果表明YJ-MICPCA总体上优于其他几种算法.
主成分分析、最大信息系数、Yeo-Johnson变换、特征抽取、降维、分类
42
O213;O235(概率论与数理统计)
国家社会科学基金资助项目17BJY210
2019-05-29(万方平台首次上网日期,不代表论文的发表时间)
共7页
220-226