特征选择稳定性研究综述
随着大数据的发展和机器学习的广泛应用,各行业的数据量呈现大规模的增长,高维性是这些数据的重要特点,采用特征选择对高维数据进行降维是一种预处理方法.特征选择稳定性是其中重要的研究内容,它是指特征选择方法对训练样本的微小扰动具有一定鲁棒性.提高特征选择稳定性有助于发现相关特征,增强特征可信度,进一步降低开销.在回顾现有特征选择稳定性提升方法的基础上对其进行分类,分析比较各类方法的特点和适用范围,总结特征选择稳定性中的相关评估工作,并通过实验剖析其中稳定性度量指标的性能,进而对比4种集成方法的效用.最后讨论当前工作的局限性,指出未来的研究方向.
高维数据、特征选择、稳定性、稳定性指标、集成选择、演化算法
29
TP391(计算技术、计算机技术)
国家自然科学基金61371196;中国博士后科学基金201003797
2018-10-10(万方平台首次上网日期,不代表论文的发表时间)
共21页
2559-2579