改进的FP-Growth算法及其分布式并行实现
针对传统FP-Growth算法在大规模数据环境下挖掘效率低下的问题,提出了一种改进的FP-Growth算法.该算法主要是通过基于频繁闭项集策略对完备模式树进行剪枝进而减小搜索空间规模,达到提高算法挖掘效率的目的.并将改进后的FP-Growth算法的分治策略与分布式计算框架Hadoop的MapReduce编程模式有机结合,进一步提高了大数据环境下的挖掘效率.实验证明,基于Hadoop的改进FP-Growth算法的效率较传统FP-Growth算法有所提高.
分布式并行、改进FP-Growth算法、剪枝、MapReduce编程模式
21
TP311.1(计算技术、计算机技术)
河北省科技支撑计划项目15210110D;唐山市科技支撑计划项目14130233B
2016-07-25(万方平台首次上网日期,不代表论文的发表时间)
共8页
20-27