基于差别矩阵和m RMR的分步优化特征选择算法
分类问题普遍存在于现代工业生产中.在进行分类任务之前,利用特征选择筛选有用的信息,能够有效地提高分类效率和分类精度.最小冗余最大相关算法(mRMR)考虑最大化特征与类别的相关性和最小化特征之间的冗余性,能够有效地选择特征子集;但该算法存在中后期特征重要度偏差大以及无法直接给出特征子集的问题.针对该问题,文中提出了结合邻域粗糙集差别矩阵和mRMR原理的特征选择算法.根据最大相关性和最小冗余性原则,利用邻域熵和邻域互信息定义了特征的重要度,以更好地处理混合数据类型.基于差别矩阵定义了动态差别集,利用差别集的动态演化有效去除冗余属性,缩小搜索范围,优化特征子集,并根据差别矩阵判定迭代截止条件.实验选取SVM,J48,KNN和MLP作为分类器来评价该特征选择算法的性能.在公共数据集上的实验结果表明,与已有算法相比,所提算法的平均分类精度提升了2%左右,同时在特征较多的数据集上能够有效地缩短特征选择时间.所提算法继承了差别矩阵和mRMR的优点,能够有效地处理特征选择问题.
特征选择、邻域粗糙集、差别矩阵、mRMR
47
TP301.6(计算技术、计算机技术)
国家自然科学基金61572406
2020-03-26(万方平台首次上网日期,不代表论文的发表时间)
共9页
87-95