10.11896/j.issn.1002-137X.2018.02.019
基于模糊质心的混合属性数据模糊加权聚类算法
在模糊聚类算法中,模糊系数被用来控制簇可能重叠的程度,其负面影响是所有的数据对象会影响所有的簇.为解决该问题,Klawonn和H(o)ppner使用模糊函数替换模糊系数(KH算法),但该方法是针对数值属性数据而设计的.然而,在许多真实的应用中,数据对象通常同时由数值属性和分类属性描述.面向混合属性数据,文中提出了一种新的基于模糊质心的模糊加权聚类算法.首先结合模糊质心和均值来表示混合属性条件下的簇中心,然后使用能够评估不同属性在聚类过程中作用的度量来评估数据对象和簇中心之间的相异度,最后给出算法框架.在3个混合属性数据集上对新算法进行了一系列的测试,实验结果表明新算法的性能优于传统算法.
模糊聚类、数据挖掘、混合数据、相异性度量
45
TP391(计算技术、计算机技术)
国家自然科学基金项目61502093,61403077;吉林省教育厅科研项目2016504;吉林省科技发展计划资助项目20170520058JH;中央高校基本科研业务费专项基金13QN002
2018-05-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
109-113