10.3969/j.issn.1006-8023.2018.04.008
云计算下Spark并行Apriori算法林业病虫害防治研究
林业病虫害防治一直是林业领域的头等大事,缺乏行之有效的决策处理是现阶段正待解决的问题之一.随着可获取的林业数据量急剧增加,数据处理难度逐渐加大,单台机器处理已无法满足当前需求.云计算作为新型计算机模式将极大提高林业病虫害防治水平.本文将基于Spark并行化框架的Apriori算法提出病虫害资源数据的云存储模式,设计林业病虫害处理过程,满足云计算环境下林业病虫害防治需求,用以解决病虫害与树种之间获取信息困难以及关联规则处理效率问题.设计多组实验,通过改变数据集大小与集群节点个数计算出集群处理时间,从而评估算法性能.结果表明,云计算环境下该并行化算法不仅在海量数据存储以及可扩展性上具有良好性能,还能高度提取出树种与虫害的关联规则,提升挖掘效率.将该方法运用于林业领域,具有极高的前瞻性和有效性,为林业梳理物种之间关系以及防治林业病虫害提供很好的决策支持.
Apriori算法、Spark框架、林业数据、数据挖掘、关联规则
34
S763;TP311.13(森林保护学)
大学生创新创业训练计划项目201710225129
2019-01-04(万方平台首次上网日期,不代表论文的发表时间)
共7页
45-51