10.3778/j.issn.1002-8331.2203-0161
结合混合密度和局部结构的密度峰值聚类算法
密度峰值聚类(DPC)是简单有效的聚类算法,但该算法存在假设与实现间不一致和假设不适用的问题,导致DPC在密度不均的数据集上很难确定中心点,且非中心点分配策略鲁棒性低并产生连锁反应.针对此,提出一种结合混合密度和局部结构的密度峰值聚类算法(HS-DPC).利用相对密度和绝对密度,提出混合密度计算公式,消除DPC假设中心点为局部峰值,但算法实现是全局峰值间的不一致.根据局部结构重新定义数据点之间的相似性,从而适应形状复杂数据.对中心点依据相似性传递,搜索有效数据并形成簇的主干结构.对剩余点结合不同簇的主干点分布进行距离最优分配,隔绝连锁反应完成边界聚类.通过在16个数据集上与五种聚类算法进行对比实验,结果表明了HS-DPC的有效性和鲁棒性.
密度峰值聚类、混合密度、局部结构、相似性传递、标签传播
59
TP391(计算技术、计算机技术)
国家自然科学基金;四川省社会科学研究规划项目
2023-06-29(万方平台首次上网日期,不代表论文的发表时间)
共10页
84-93