10.3969/j.issn.1673-808X.2016.05.009
基于Hadoop的DG-Apriori算法
针对Apriori算法需要多次扫描数据库、产生庞大的候选项集和计算时间过长等问题,提出一种基于Hadoop平台的DG-Apriori算法.该算法改进了频繁项集的连接方式,只需用频繁(k-1)-项集与频繁1-项集连接即可生成频繁k-项集,极大地减少了连接次数,避免了产生庞大的候选项集,并且将改进后的Apriori算法以并行处理方式移植到Hadoop平台,并行地计算频繁项集,减少了计算时间.实验结果表明,DG-Apriori算法大大提高了Apriori算法的性能.
Apriori算法、数据库、Hadoop、频繁项集
36
TP301.6(计算技术、计算机技术)
国家自然科学基金61363031,61461010;广西高校云计算与复杂系统重点实验室研究课题14101;桂林电子科技大学研究生教育创新计划GDYCSZ201450
2016-11-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
387-390