10.11896/j.issn.1002-137X.2015.3.050
基于近邻传播聚类的集成特征选择方法
针对高维数据中的类标记仅与少部分特征关联紧密的问题,提出了基于排序聚合和聚类分组的特征随机选择集成学习方法.采用排序聚合技术对特征进行过滤,选出与样本分类相关的特征,以bicor关联系数作为关联衡量标准,利用近邻传播聚类算法进行分组,使不同组的特征互不关联,然后从每个分组中随机选择一个特征生成特征子集,便可得到多个既存在差异性又具备区分能力的特征子集,最后分别在对应的特征子空间训练基分类器,采用多数投票进行融合集成.在7个基因表达数据集上的实验结果表明,提出的方法分类误差较低,分类性能稳定,可扩展性好.
分类、排序聚合、近邻传播聚类、集成特征选择
42
TP391(计算技术、计算机技术)
辽宁省自然科学基金项目20130200029
2015-04-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
241-244,260