10.12011/1000-6788-2020-0151-13
基于特征子空间与流形正则化的高效增量半监督特征选择方法
基于Fisher Score的前向序列选择法是目前性能良好并广泛使用的一种有监督特征选择方法.然而,该方法只能对有标签样本进行分析,无法利用大量"廉价"的无标签样本信息;并且随着已选特征的个数的增加,对候选特征进行评分的计算复杂度呈三次方形式增加.针对这两个问题,提出基于特征子空间与流形正则化的高效增量半监督特征选择方法.一方面,该方法通过提取有标签与无标签数据的局部线性表示来进行半监督特征选择,使得所选特征能够保持数据的局部流形结构信息;另一方面,该方法基于特征子空间理论进行特征评分,时间复杂度取决于特征空间的维数而非已选特征的个数,如果特征空间的维数是固定的,该方法将花费几乎恒定的时间来评价每一个候选特征.相比于基于Fisher Score的前向序列选择法选择特征的三次方复杂度,所提方法在时间效率方面得到很大提升.在五个标准数据集上进行了实验,所得结果验证了该方法的有效性.
半监督学习、特征选择、流形正则化、特征子空间
40
O235(控制论、信息论(数学理论))
国家自然科学基金61503263
2020-12-21(万方平台首次上网日期,不代表论文的发表时间)
共13页
2968-2980