10.3969/j.issn.1002-137X.2010.12.032
一种结合散列与位表挖掘频繁项目集算法
在频繁项集的挖掘中,很多算法都是基于Apriori的.这些算法有两个共同的问题:一是把整个数据库装入内存,占用大量的空间;二是在产生候选项集和计算支持度时花费了大量的时间.为了提高效率,提出了一种基于位表挖掘频繁项目集的算法Hash-BFI.按照水平和垂直的方向把数据库压缩到位表内,以大大节省内存空间.引入散列函数计算频繁二项集,完全通过AND,OR运算得到候选项集和计算候选项集支持度,并进行剪枝,从而提高了算法效率.
Apriori、频繁项集、位表、散列
37
TP3;TP1
国家自然科学基金项目60603047;辽宁省科技计划项目2008216014;大连市优秀青年科技人才基金2008J23JH026;教育部留学回国人员科研启动基金
2011-03-18(万方平台首次上网日期,不代表论文的发表时间)
共4页
145-148