10.3778/j.issn.1002-8331.1808-0423
DBSCAN算法研究及并行化实现
DBSCAN算法是一种基于密度的优秀算法,能够对任意形状的数据进行聚类,且能够识别噪声数据.为了减少人工对输入参数Eps和MinPts的干预,提出了一种新的计算Eps参数的方法;同时,为了解决传统单机DBSCAN算法在大数据环境下的性能问题,基于Spark框架实现了DBSCAN算法的并行化.通过实验表明,提出的DBSCAN改进算法具有很高的准确度和稳定性;并行实现的DBSCAN算法具有很好的并行性能,适合用于处理海量数据聚类.
大数据、DBSCAN算法、ApacheSpark、分布式计算
54
TP391(计算技术、计算机技术)
江苏省自然科学基金BK20140165;教育部-新华三集团"云数融合"基金2017A13055
2019-01-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
52-56,122