改进的FP-growth关联规则挖掘算法
数据挖掘技术被广泛用于处理存储在数据库中的大量数据,以提取所需的信息.其有多种获取数据的技术,关联规则挖掘是其中最有效的数据挖掘技术之一.它从大量数据中发现隐藏的所需数据模式.在现有技术中的频繁模式生长(FP-growth)算法是找到期望关联规则的最有效的算法,它只需扫描数据库两次进行处理.但FP-growth算法的问题是在大规模数据环境下它生成大量的条件FP树,造成挖掘效率低下的问题.在提出算法中,我们设计了一种新技术,它挖掘出所有的频繁项集,而不产生条件FP树.与传统FP-growth算法不同,它仅扫描数据库一次,这降低了算法的时间效率.并且找出频繁项集合的频率,以获取所需的关联规则.实验证明,改进FP-growth算法的效率较传统FP-growth算法有很大提高.
FP树、关联规则、频繁项集、数据挖掘
13
TP391(计算技术、计算机技术)
2017-07-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
5-8,14