10.7544/issn1000-1239.2016.20160136
基于局部密度下降搜索的自适应聚类方法
聚类分析是数据挖掘中一个重要的研究领域,用于在无监督条件下,从混合类别的数据集中分离各样本的自然分组。根据不同的先验条件,现已提出了多种不同的聚类算法。但复杂数据集中存在的聚类个数未知、聚类形态混杂、样本分布不均匀以及类间样本数不均衡等问题,仍然是当前聚类分析研究中的重难点问题。针对这些问题,通过定义样本分布的局部密度,提出了一种利用类内密度有序性搜索聚类边界的新的聚类方法,能够实现在未知聚类个数条件下,对任意分布形态的数据样本集进行聚类。同时,通过自适应调节聚类参数来处理数据分布疏密度不一、类间样本数不均衡以及局部密度异常等特殊情况,避免样本类别被误划分和噪声数据干扰。实验结果表明,在6类典型测试集上,提出的新聚类算法均有较好的适用性,而在与典型聚类算法和最近发表的一种聚类算法的性能指标对比上,新算法也表现更优。
数据挖掘、聚类、局部密度、下降搜索、自适应
53
TP391(计算技术、计算机技术)
2016-08-19(万方平台首次上网日期,不代表论文的发表时间)
共10页
1719-1728