一种改进的子空间选择算法在聚类中的应用
高维空间聚类由于其数据分布稀疏、噪声数据多、"差距趋于零现象"等特征,因而给传统的聚类方法带来很大的阻碍.为了解决这些问题,介绍了一种对于潜在子空间的选择方法.原有方法采用k邻近点的原理,根据不同聚簇分布情况在k邻近点统计应用上的不同特征,制定出衡量子空间优劣的标准,从而获得进一步进行简单聚类的子空间.结合近似邻近点搜索方法对其进行改进,改进后的子空间选择方法能更好地探测到聚簇的存在情况,并有效地拓展了子空间聚类算法的应用范围.实验结合生物统计学上的基因变异数据集进一步证实了方法的有效性和可行性.
聚类、子空间、k邻近、近似邻近
44
TP311(计算技术、计算机技术)
2008-06-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
129-134