10.11896/j.issn.1002-137X.2015.11.016
基于MapReduce的MIC算法并行化
MIC是一种分析变量之间可能存在的关系的方法.该方法不仅能够有效识别出变量间各种复杂类型的关系,还能够准确描述噪音数据对存在关系的影响,对探索大数据集中变量之间的关系具有重要意义.针对该方法在处理包含大量变量的数据集时性能方面的不足,首次对它进行了基于MapReduce模型的并行化.提出的并行化方法首先对原算法进行更细颗粒度的划分,然后采用一种基于Map-Reduce-Map任务链的并行模型,该模型不仅有效地增加了并行的计算单元,还大大地降低了不必要的系统开销.最后,通过理论分析和实验验证得出,改进后的算法与原算法相比,在准确率方面具有等效性,运行速度大幅度提升且具有良好的可扩展性;实验同时指出了算法性能的提升与系统资源的关系.
大数据、MIC、关系挖掘、MapReduce、并行化
42
TP311(计算技术、计算机技术)
广西自然科学基金2011GXNSFA018156;研究生创新项目GDYCSZ201464
2015-12-07(万方平台首次上网日期,不代表论文的发表时间)
共5页
80-83,103