10.13413/j.cnki.jdxblxb.2016.03.27
基于垂直格式的频繁项集挖掘分段算法
针对 Eclat 算法连接和剪枝操作耗时的缺点,按照项集之间的可连接性,将数据集划分为等价类并分段存储,采用末项剪枝策略,在常量时间内完成连接和剪枝操作。针对 Eclat 算法求长集合的交集操作需要大量计算的缺点,采用多维数组分段存储项集的事务集,将长集合的求交集操作转换为分段求短集合的交集,并提出期望支持度的概念,在求交集的过程中预测支持度,从而减少求交集的比较次数。实验结果表明,该算法在时间性能方面优于 Eclat算法,尤其适用于挖掘长模式稀疏数据集。
频繁项集、垂直格式、分段存储、期望支持度
54
TP311.13(计算技术、计算机技术)
国家自然科学基金61133011;吉林省教育厅“十二五”科学技术研究项目2013431
2016-07-04(万方平台首次上网日期,不代表论文的发表时间)
共8页
553-560