10.3969/j.issn.1006-2475.2015.08.024
一种改进型的分布式 Lazy 关联分类算法
分布式lazy关联分类算法( DLAC算法)指应用分布式关联规则挖掘算法的lazy关联分类算法。现有的DLAC算法存在2个主要问题:一是对多个待分类样本进行分类时效率低下;二是投影操作未分布式实现。针对上述2个问题,提出一种改进型的分布式lazy关联分类( PDLAC)算法。首先,对待分类样本进行KMeans聚类;其次,判断类内的待分类样本是否满足聚合条件,满足进行聚合,不满足则类内的每个待分类样本单独成为一类;然后,进行分布式投影并使用C-DMA算法挖掘关联规则;最后,构建分类器对类内的一个或多个待分类样本进行分类。设置并行度为15进行实验:PD-LAC算法所用的时间远小于DLAC算法,并且随着待分类样本数目的增加,性能提升越大。实验结果表明,PDLAC算法是解决上述2个问题的一个好方法。
聚合方法、分布式投影、分布式关联规则挖掘、lazy方法、关联分类
TP312(计算技术、计算机技术)
2015-09-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
116-120