10.3969/j.issn.1673-808X.2017.02.008
一种基于Hadoop的关联规则改进算法
针对传统的频繁模式增长算法(FP-Growth)在工作过程中会产生大量的条件FP-tree,存在时间和空间复杂度的问题,提出了一种基于Hadoop的改进的FP-Growth算法IFPH.IFPH通过Hadoop实现了并行化计算,并且在构建频繁模式树的过程中引入剪枝策略,压缩频繁模式树的规模,减少数据的处理量,采用不同规模的数据和计算节点数评估算法的性能.实验结果表明,IFPH算法的处理效率随着数据规模和计算节点数的增加而提高,具有很好的可行性和扩展性.
FP-Growth、FP-tree、频繁项集、Hadoop
37
TP311.11(计算技术、计算机技术)
国家自然科学基金61163058;广西可信软件重点实验室基金KX201306
2017-06-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
122-126