10.3321/j.issn:0469-5097.2008.05.008
基于图的最大频繁项集的生成算法
挖掘频繁项集是数据挖掘的重要技术之一,目前已有很多经典算法,如:apriori算法,FP-tree 等.挖掘频繁项集主要是寻找最大频繁项集,为了快速寻找最大频繁项集,通常采用削减候选项集、减少扫描数据库次数的方法和将自底向上与自顶向下的搜索方法结合起来(又称双向搜索).双向搜索能有效地缩减搜索空间.本文把基于图的关联规则挖掘和双向搜索的思想结合起来产生最大频繁项集,提出了基于图的最大频繁项集生成算法.此算法用图将数据映射到一个向量上,通过一遍扫描数据库就可以构造整个频繁项集,结合双向搜索,能快速生成频繁项集,对产生较大长度的最大频繁项集也有较好的效果.文末,把基于图的关联规则挖掘算法和基于图的最大频繁项集算法进行了比较,分析出性能差别的原因.
关联规则、最大频繁项集、图
44
TP311(计算技术、计算机技术)
国家自然科学基金60503021,60721002,60875038;江苏省高新技术计划BG2007038,BG2006027
2009-02-11(万方平台首次上网日期,不代表论文的发表时间)
共7页
520-526