基于最小生成树的分割区域密度聚类算法
针对传统密度聚类算法因使用全局变量导致对不平衡数据集的适应能力较差的问题,提出了一种基于最小生成树的密度聚类算法.首先进行数据集密度峰值计算,用于估计全局密度;然后通过密度聚类将数据集划分为高密度区域和低密度区域;接着构建和分割最小生成树对低密度区域内样本进行关联挖掘,用于将高密度区域与低密度区域互联;最后计算簇密度并以此作为特征进行簇合并,得到聚类结果.该算法结合图论知识,将数据按密度特征进行分块后合并处理,克服了传统密度聚类算法存在的局限性.通过选取多个不平衡人工数据集和UCI数据集对该算法进行测试,验证了该算法的有效性与鲁棒性.
最小生成树、密度聚类、不平衡数据集
31
TP181(自动化基础理论)
国家重点研发计划项目2017YFC0804406;国家自然科学基金91746104
2019-11-18(万方平台首次上网日期,不代表论文的发表时间)
共8页
1628-1635