最近邻优化的k-means聚类算法
传统的k-means算法不论其数据样本的分布情况,将簇边缘位置、簇中心位置、离群点的数据样本全部按照最小距离原则,划分到离它最近的聚类中心所在簇中,没有考虑数据样本与其他簇之间的关系.如果数据样本与另一簇中心的距离接近于最小距离,则此数据样本与两个簇的关系都很大,显然这样直接划分并不合理.针对此问题,文中提出了最近邻优化的k-means聚类算法.运用近邻的思想,将这些不"很属于"某簇的数据样本划分到其最近邻数据样本所在的簇中,实验结果表明,这种最近邻优化的k-means聚类算法有效地减少了算法的迭代次数,提高了算法的聚类准确度,得到了良好的聚类效果.
k-means、分布、关系、簇、最近邻
46
TP181(自动化基础理论)
天津市自然科学基金重点项目13jczdjc34400;河北省科技计划项目17214304D;天津市科技重大专项14ZCDZGX00818
2019-12-19(万方平台首次上网日期,不代表论文的发表时间)
共4页
216-219