自适应K-均值聚类算法

引用

摘要：

为了提高传统K-均值聚类的稳定性和可靠性,提出了一种自适应的K-均值聚类算法,其基本思想是通过分析样本集的最小树并切割其中所有超过一定阈值的较长边,根据样本集的结构特征事先自动地计算出合理的聚类个数和合理的初始聚类中心.理论分析和计算实验表明,该算法不仅能够保证聚类结果的惟一性,而且在样本集的各个聚类具有大致凸的形状时,如果类间距离明显大于类内距离,不需要人工选择参数就能直接获得较好的聚类结果.对于同样的数据集而言,即使选择了正确的聚类个数,传统的K-均值算法也可能给出不合理的聚类结果,因此自适应的K-均值聚类算法具有更好的性能.

关键词：K-均值算法、自适应、最小树、聚类个数、聚类中心

所属期刊栏目：44

分类号：TP18(自动化基础理论)

资助基金：北京市自然科学基金4052005;北京市属市管高等学校中青年骨干教师培养计划基金

在线出版日期：2008-06-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：100-104

英文信息展示

期刊专题