一种有效的高维数据分类算法
在这个大数据时代,我们时常与数据打着交道.通常我们可以用一个向量来表示一个数据样本,数据的维度就是向量的维度.比如我们常见的二维数据、三维数据可以直观地可视化.有的数据维度非常高,比如描述人脸、声音等的数据样本它们的维度就通常高达上百.通过简单的欧式聚类来进行数据样本的分类,在低纬度数据样本中大多有良好的分类结果.但是在高维数据的分类问题中,基于欧式距离的分类方法通常都会失效.所以针对高纬度数据的分类提出一种简单有效的方法是具有一定意义的.该文的创新点在于:针对不同维度数据的子空间分类以及多流形分类问题,该文提出了"种子生长模型"较好地解决了该问题.该模型在通过模拟种子的非线性传播与生长的同时,加以生长规则的限制,使得与种子具有较高相似性的样本被不断地归类,其他的样本点逐渐成为新的种子,种子再不断更新与生长,最终完成分类.该模型具有较强的一般性与适应性,能够较好地解决不同维度样本的子空间分类与多流形分类问题.
数据分类、高维数据、生长算法
13
TP311(计算技术、计算机技术)
2017-05-05(万方平台首次上网日期,不代表论文的发表时间)
共2页
5-6