自适应区间配置在关联规则并行采掘中的作用
现行的采掘关联规则的并行算法基于经典的层次算法.该方法在每一次重复扫描数据库时都需要一次同步,这种同步运算对于共享内存多处理器并行机来说极大地降低了采掘性能,这种低效主要源于对共享的I/O通道的竞争.该文提出了在共享内存多处理机上采掘关联规则的异步算法APM.在APM中,所有参与计算的处理器能独立地产生备选集和计算支持度.而且,APM所需的扫描数据库的次数比层次方法所需的更少.该文还提出了一种增强APM的技术,使得该算法的性能对于数据分布更具有鲁棒性.文中实现了APM的变种算法,还实现了Apriori的并行版本Count Distribution算法.在SGI Power Challenge SMP并行机上,进行了性能分析,结果表明所提出的异步算法APM具有更好的性能和可扩展性.
关联规则、数据采掘、并行采掘、共享内存多处理器、交易数据库
11
TP311(计算技术、计算机技术)
中国科学院资助项目79970052;RGCthe Hong Kong Research Grants Council338/065/0032
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共14页
159-172