10.3969/j.issn.1002-137X.2012.01.030
面向大规模数据的快速并行聚类划分算法研究
随着聚类分析中处理数据量的急剧增加,面对大规模数据,传统K-Means聚类算法面临着巨大挑战.为了提高传统K-Means聚类算法的效率,针对已有基于MPI的并行K-Means聚类算法和基于Hadoop的分布式K-Means云聚类算法,从聚心初始化和通信模式等入手,提出了改进思路和具体实现.实验结果表明,所提算法能大大减少通信量和计算量,具有较高的执行效率.研究结果可以为以后设计更好的大规模数据快速并行聚类划分算法提供研究依据.
云计算、K-Means、大规模数据、MPI、Hadoop
39
TP393(计算技术、计算机技术)
中央高校基本科研业务费电子科技大学项目ZYGX2010J075
2012-04-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
134-137,151