基于启发式确定类数的NJW谱聚类算法
基于图论理论的NJW谱聚类算法的核心思想是将数据点映射到特征空间后再利用K-means算法进行聚类,从而得到原始数据的聚类结果.NJW算法是K-means算法的推广,并且在任意形状的数据上都具有较好的聚类效果,从而有着广泛的应用.但是,类数C和高斯核函数中的尺度参数σ较大程度地影响着NJ W的聚类性能;另外,K-means对随机初始值的敏感性也影响着NJW的聚类结果.为此,一种基于启发式确定类数的谱聚类算法(记为DP-NJW)被提出.该算法先根据数据的密度分布确定类中心点和类数,这些类中心点作为特征空间中K-means聚类的初始类中心,然后用NJ W进行聚类.文中通过实验将DP-NJ W算法和经典聚类算法在7个公共数据集上进行测试和对比,其中DP-NJ W算法在5个数据集上的聚类精度高于NJ W的平均聚类精度,在另2个数据集上二者持平.对比DPC算法,所提算法在5个数据集上也有不俗的聚类精度,而且DP-NJW的计算消耗较小,在较大的数据集ag-gregation上表现更为突出.实验结果表明,文中所提的DP-NJW算法更具优势.
谱聚类、NJW聚类、高斯核函数、尺度参数、聚类精度
45
TP181(自动化基础理论)
河北省自然科学基金F2016201161;国家自然科学基金61473111
2018-12-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
474-479