10.11896/j.issn.1002-137X.2017.04.043
基于MIC集群平台的GMRES算法并行加速
广义极小残量法(GMRES)是最常用的求解非对称大规模稀疏线性方程组的方法之一,其收敛速度快且稳定性良好.Intel Xeon Phi众核协处理器(MIC)具有计算能力强、易编程、易移植等特点.采用MPI+ OpenMP+ offload混合编程模型将GMRES算法移植到MIC集群平台上.采用进程间集合通信异步隐藏、数据传输优化、向量化以及线程亲和性优化等多种手段,大幅提升了GMRES算法的求解效率.最后将并行算法应用到“局部径向基函数求解高维偏微分方程”问题的求解中.测试表明,CPU节点集群上开启32个进程,并行效率高达71.74%,4块MIC卡的最高加速性能可达单颗CPU的7倍.
广义极小残量法、MIC、MPI、大规模线性方程组
44
TP391;O246(计算技术、计算机技术)
2017-05-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
197-201,240