10.3321/j.issn:1001-0505.2007.04.006
DMGSP:一种快速分布式全局序列模式挖掘算法
为了解决分布式环境下挖掘全局序列模式常产生过多候选序列,加大网络通信代价问题,提出了一种基于分布式环境下的快速挖掘全局序列模式算法--DMGSP.该算法将分布式环境下的各站点得到的局部序列模式压缩到一种语法序列树上, 避免了重复的序列前缀传输. 采用合并树中结点序列规则和项序扩展策略,对非频繁序列进行剪枝,有效地约简了候选序列,减少了网络传输量,从而快速生成全局序列模式.算法分析和实验结果表明,在大数据集环境下的DMGSP算法性能优越,能够有效地挖掘全局序列模式.
数据挖掘、分布式系统、全局序列模式、语法序列树
37
N945;TP311(系统科学)
国家自然科学基金70472033;江苏省 青蓝工程基金
2007-09-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
574-579