一种基于标签相关度的Relief特征选择算法
特征选择在机器学习和数据挖掘中起到了至关重要的作用.Relief作为一种高效的过滤式特征选择算法,能处理多种类型的数据,且对噪声的容忍力较强,因此被广泛应用.然而,经典的Relief算法对离散特征的评价较为简单,在实际进行特征选择时并未充分挖掘特征与类标签之间的潜在关系,具有很大的改进空间.针对经典的Relief算法对离散特征的评价方式较为简单这一不足,提出了一种基于标签相关度的离散特征评价方法.该算法充分考虑了不同特征的特性,给出了一种面向混合特征的距离度量方式,同时从离散特征与标签之间的相关度出发,重新定义了Relief算法对离散特征的评价体系.实验结果表明,改进后的Relief算法与经典的Relief算法和现有的一些面向混合数据的特征选择算法相比,其分类精度均有不同程度的提升,具有良好的性能.
特征选择、Relief、标签相关度、VDM、决策树
48
TP181(自动化基础理论)
国家自然科学基金;山西省应用基础研究项目
2021-04-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
91-96