10.3778/j.issn.1002-8331.2009.06.040
挖掘最大频繁项集的事务集迭代算法
发现最大频繁项目集是数据挖掘应用中的关键问题;提出一种新的基于事务集迭代的求最大频繁项集算法,该算法在每次迭代时,通过对输入事务集的两次扫描,生成所有阶数的候选项集和频繁项集;每次迭代后又生成新的事务集作为下一次迭代的输入,而候选最大频繁项集集合则随着迭代不断地趋于完整.该算法不需要生成K-1阶候选项集或频繁树,有别于已有的经典算法;同时由于用于迭代的事务集的数据量会快速缩减,从而也可有效降低算法的时间复杂度.实验表明在大数据量和小最小支持度时该算法更为有利.
最大频繁项集、候选项集、事务集、迭代
45
TF311(冶金机械、冶金生产自动化)
辽宁信息科学与工程重点实验室开放课题The Sponsored Research by Liaoning Key Laboratory for Information Science & Engineering under Grant 2005003;2008年大连市IT优秀教师科研基金Dalian Scientific Foundation for Prominent IT Teacher.2008
2009-04-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
141-144