DOI：10.3969/j.issn.1006-2475.2019.04.001

基于优化初始聚类中心的K中心点算法

引用

摘要：

针对K中心点算法的初始聚类中心可能过于临近、代表性不足、稳定性差等问题,提出一种改进的K中心点算法.将样本集间的平均距离与样本间的平均距离的比值作为样本的密度参数,精简了高密度点集合中候选代表点的数量,采用最大距离乘积法选择密度较大且距离较远的K个样本作为初始聚类中心,兼顾聚类中心的代表性和分散性.在UCI数据集上的实验结果表明,与传统K中心点算法和其他2种改进聚类算法相比,新提出的算法不仅聚类结果更加准确,同时也具有更快的收敛速度和更高的稳定性.

关键词：密度、初始聚类中心、K中心点、绝对误差

分类号：TP301.6(计算技术、计算机技术)

资助基金：广东高校省级重大科研项目2017GkQNCX033;韶关市科技计划项目2017CX/K055;广东松山职业技术学院重点科技项目2018KJZD001;广东大学生科技创新培养专项资金资助项目pdjh2015a0715

在线出版日期：2019-05-28（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：1-5

英文信息展示

期刊专题