10.3969/j.issn.1002-137X.2004.12.038
挖掘最大频繁项集的并行算法
频繁项集的挖掘是数据挖掘的核心内容.本文提出挖掘最大频繁项集的并行算法P-MinMax,它采用数据库的垂直表示和基于前缀关系的等价类划分,利用因子项集的完全包含关系在处理机之间贪心分配等价类,根据等价类的需要相应地划分和有选择地复制数据库记录,使各处理机得以异步计算,达到了较好的负载平衡.分析和实验表明,P-MinMax有较好的可扩展性,其性能优于已有同类算法.
频繁项集、并行算法、数据挖掘
31
TP3;O17
国家自然科学基金60273075
2005-01-20(万方平台首次上网日期,不代表论文的发表时间)
共4页
132-134,188