10.3778/j.issn.1002-8331.1305-0161
一种基于FP-Growth的频繁项目集并行挖掘算法
FP-Growth算法是基于FP树挖掘频繁项目集的经典算法,为提高FP-Growth算法挖掘大规模数据频繁项目集的效率,提出了一种基于FP-Growth的频繁项目集并行挖掘算法FPPM。该算法基于Map/Reduce并行模型,在每个计算节点上首先构造局部频繁模式树,并对之进行挖掘得到局部频繁项目集,然后合并局部频繁项目集以得到全局频繁项集,由于此时得到的结果并不完备,所以对合并后未达到最小支持度阈值的项目集,重新计算其支持数。介绍了FPPM算法的设计思想,测试了其性能。实验结果表明FPPM算法具有较好的可扩展性。
频繁项目集、并行挖掘、FP-Growth、Map/Reduce
TP311.11(计算技术、计算机技术)
江苏省自然科学基金重点项目No.BK2011005。
2014-01-23(万方平台首次上网日期,不代表论文的发表时间)
共4页
103-106