基于自然最近邻的密度峰值聚类算法
针对密度峰值聚类算法(Density Peaks Clustering,DPC)需要人为指定截断距离dc,以及局部密度定义简单和一步分配策略导致算法在复杂数据集上表现不佳的问题,提出了一种基于自然最近邻的密度峰值聚类算法(Density Peaks Clustering based on Natural Nearest Neighbor,NNN-DPC).该算法无需指定任何参数,是一种非参数的聚类方法.该算法首先根据自然最近邻的定义,给出新的局部密度计算方法来描述数据的分布,揭示内在的联系;然后设计了两步分配策略来进行样本点的划分.最后定义了簇间相似度并提出了新的簇合并规则进行簇的合并,从而得到最终聚类结果.实验结果表明,在无需参数的情况下,NNN-DPC算法在各类数据集上都有优秀的泛化能力,对于流形数据或簇间密度差异大的数据能更加准确地识别聚类数目和分配样本点.与DPC、FKNN-DPC(Fuzzy Weighted K-nearest Density Peak Clustering)以及其他3种经典聚类算法的性能指标相比,NNN-DPC算法更具优势.
聚类算法、自然最近邻居、密度峰值、局部密度
48
TP301.6(计算技术、计算机技术)
国家自然科学基金11671205
2021-03-15(万方平台首次上网日期,不代表论文的发表时间)
共7页
151-157