10.3969/j.issn.2095-2163.2015.01.012
基于MapReduce的并行k-modes算法
k-modes是一种代表性的分类数据的聚类算法.首先对k-modes聚类算法的实现过程进行了改进:通过在分配数据对象到簇时更新这个簇中各个属性项的次数,使得在遍历一次全部数据对象就能计算出新的簇中心.为了使k-modes能够处理大规模分类数据,在Hadoop平台上用MapReduce并行计算模型实现了k-modes算法.实验表明:在处理大量数据时,并行k-modes比串行k-modes极大地缩短了聚类时间,取得了较好的加速比.
分类数据、k-modes、并行聚类、MapReduce
5
TP312(计算技术、计算机技术)
国家自然科学基金61103046;上海市自然科学基金11ZR1401200
2015-05-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
43-45