10.3969/j.issn.1671-1815.2018.07.033
云计算环境下关联性大数据实时流式可控聚类算法
针对传统聚类算法效率低、效果差和稳定性弱等弊端,提出一种新的云计算环境下关联性大数据实时流式可控聚类算法.介绍了关联性实时流式数据的定义和特点.通过粗聚类对实时抵达的数据元组进行相应的预处理,确定类簇的数量与中心点位置,形成通过存在差异的宏簇构成的集合,粗聚类采用的算法为Canopy算法.将粗聚类得到的宏簇传至K-means算法,给出了K-means算法的详细步骤,通过K-means算法完成细聚类,介绍了整个细聚类详细步骤.实验结果表明,所提算法具有效率高、质量好、稳定性强等优势,可有效实现云计算环境下关联性实时流式大数据聚类.
云计算、关联性、大数据、实时流式、聚类
18
TP391.3(计算技术、计算机技术)
2018-04-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
185-190