10.3969/j.issn.1674-7933.2016.06.15
一种基于相关系数的模糊C-均值聚类算法
针对传统模糊C-均值聚类算法同等对待每个属性的局限性和初始聚类中心选择的随机性,提出了一种基于相关系数优化的模糊C-均值聚类算法.首先,该算法通过计算离散系数和信息熵来确定每个属性的权重,从而强化了重要属性对聚类过程的影响,削弱了冗余属性的作用,改善了聚类效果;其次,采用相关系数和密度函数来确定样本点的密度,从而突出了样本点在同一类别中的作用;再次,将归一化后的样本点密度作为每个样本的权值;最后,由相关系数及样本点密度确定初始聚类中心.实验结果表明,该算法比传统的FCM算法具有更好的聚类效果.
模糊C均值算法、离散系数、信息熵、属性权重、相关系数、密度函数
TP3;S43
2017-01-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
50-53