10.3969/j.issn.1671-2153.2015.05.020
基于MapReduce的Apriori算法并行化研究
针对目前传统的Apriori算法对硬件要求较高且运算效率低下的情形,提出将经典的数据挖掘关联规则算法Apriori移植到云计算平台,并结合MapReduce机制进行海量数据挖掘,有效地解决了传统Apriori算法存在的瓶颈问题以及对硬件要求高的依赖。通过数据和节点对比实验共同验证了移植后的Apriori算法的运算效率比传统的Apriori算法提高了许多倍,且随着数据量和节点数的增加效果愈发明显。由于改良后的Apriori算法具有高效性和可行性,这将为解决当前大数据挖掘问题提供了一种全新的、有效的解决方案,并且这一结论还可为其他数据挖掘算法的移植提供可靠的参考。
Apriori算法、数据挖掘、关联规则、云计算、MapReduce机制
TP399(计算技术、计算机技术)
广东省高等教育学会高职高专云计算与大数据专业委员会教育科研基金项目GDYJSKT14-02;汕尾职业技术学院精品资源共享课建设重点课题Swzyjpkc14002;汕尾职业技术学院科研处重点课题SWKT15-002
2015-11-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
76-80