基于数据间内在关联性的自适应模糊聚类模型
提出了一种新的模糊聚类模型(Fuzzy C-means clustering model,FCM),称为自适应模糊聚类(Adaptive FCM,AFCM).和现有的大多数模糊聚类方法不同的是,AFCM考虑了数据集中全体数据的内在关联性,模型中引入了自适应度向量W和自适麻指数p.基中,W在迭代过程中是自适应的,p是一个给定参数.W和p共同作用调控聚类过程.AFCM同时输出三组参数:模糊隶属度集U,自适麻度向量W,以及聚类原型集V.本文给出了两组数据实验验证AFCM的性能.第1组实验验证AFCM的聚类性能,以FCM为比较对象.实验表明AFCM可以得到更好的聚类质量,而且通过合理选择自适应指数p,AFCM和FCM在时间复杂性上保持同一水平.第2组实验检验了AFCM的离群点挖掘性能,以目前常用的基于密度的LOF为比较对象.实验表明AFCM算法具有极大的计算效率优势,且AFCM得到的离群点是全局的,反映的是离群点和整个数据集的关系,离群点涵盖的信息也更丰富.文章指出,AFCM在挖掘大数据集和实时数据中的离群点应用方面,以及获得高质量的聚类结果的麻用方面,特别在聚类的同时需要挖掘离群点的应用方面具有独特的优势.
模糊聚类、离群点挖掘、自适应聚类策略、自适应度、自适应指数
36
TP3(计算技术、计算机技术)
国家自然科学资金资助50875159
2011-03-03(万方平台首次上网日期,不代表论文的发表时间)
1544-1556