10.3772/j.issn.1002-0470.2008.03.008
一种基于索引数组的频繁项集高效挖掘算法
为改进基于数据库垂直表示的频繁项集挖掘算法的性能,给出了用索引数组方法来改进计算性能的思路.提出了索引数组的概念及其计算方法,并提出了一种新的高效的频繁项集挖掘算法Index-FIMiner.该算法大大减少了不必要的tidset求交及相应的频繁性判断操作,同时也论证了代表项可直接与其包含索引中的所有项集的组合进行连接,这些结果项集的支持度均与代表项的支持度相等,从而降低了这些频繁项集的处理代价,提高了算法的性能.实验结果表明,Index-FIMiner算法具有较高的挖掘效率.
数据挖掘、关联规则、频繁项集、索引数组、包含索引
18
TP3(计算技术、计算机技术)
国家自然科学基金60675030;60463003;中国博士后科学基金20060390399
2008-06-23(万方平台首次上网日期,不代表论文的发表时间)
共6页
259-264