10.13546/j.cnki.tjyjc.2017.04.003
基于稀疏聚类的高维数据特征选择及应用
文章研究了一种高维数据聚类特征选择方法——稀疏聚类,稀疏聚类是通过对特征变量赋予权重,并添加lasso惩罚因子,压缩权重,得到对变量的权重排序,即重要性排序,使其在进行分类预测的同时达到自动剔除冗余变量的效果,从而起到了对高维数据聚类时的特征选择作用.将此方法运用于中国环保问题,将中国31个省份根据环保情况分为3类,并从现有的104个环保指标中筛选得到20个重要指标.
稀疏聚类、高维数据、聚类、特征选择
TP391(计算技术、计算机技术)
中国人民大学科学研究基金中央高校基本科研业务费专项资金资助项目15XNL008
2017-05-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
18-24