数值型和分类型混合数据的模糊K-Prototypes聚类算法
由于数据库经常同时包含数值型和分类型的属性,因此研究能够处理混合型数据的聚类算法无疑是很重要的.讨论了混合型数据的聚类问题,提出了一种模糊K-prototypes算法.该算法融合了K-means和K-modes对数值型和分类型数据的处理方法,能够处理混合类型的数据.模糊技术体现聚类的边界特征,更适合处理含有噪声和缺失数据的数据库.实验结果显示,模糊算法比相应的确定算法得到的结果准确度高.
数值型属性、分类型属性、确定聚类、模糊聚类
12
TP311(计算技术、计算机技术)
国家自然科学基金69983011
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共13页
1107-1119