10.3778/j.issn.1002-8331.2006-0318
二次幂耦合的K-means聚类算法研究
在聚类研究中,通常认为数据集的对象、属性等方面是满足独立同分布的,它们之间是互不影响的,然而实际上它们之间存在着某些潜在的联系,即非独立同分布.为了更好地挖掘其存在的潜在关系,将数据集进行二次幂处理,计算皮尔森相关系数后得到二次幂耦合的数据集样本,为了解决K-means聚类算法存在选取初始中心点的敏感性问题,基于密度的思想,通过计算密度参数合理调整高密度区域,利用聚类迭代的方法进行选点,将高密度区域中的密度最大点作为初始点,距离初始点最远点作为第二个点,以前两个点为中心聚类迭代得到两个质心,将距离两个质心最远的点作为第三点,以此类推,实验结果表明所给的算法能够得到较高的准确率,较少的迭代次数,以及相对较好的聚类效果.
非独立同分布、二次幂耦合、皮尔森相关系数、聚类迭代、K-means聚类算法
57
TP301.6(计算技术、计算机技术)
国家自然科学基金61502259
2021-07-22(万方平台首次上网日期,不代表论文的发表时间)
共8页
95-102