面向异构众核架构的块Gauss-Seidel/Jacobi预条件算法
Gauss-Seidel算法作为线性方程组的求解器,在并行计算领域具有广泛应用,而面向异构众核架构开发其细粒度并行性一直是具有挑战性的问题.针对非结构网格问题,基于代数分块并行思路提出了面向异构众核架构的块Gauss Seidel/Jacobi算法,将其作为区域分解算法的子区域求解器.面向神威太湖之光超级计算机的异构众核架构,设计并实现了该算法.为充分利用神威太湖之光国产SW26010芯片中每个CPE拥有的高速LDM(Local Data Memory),缓解通信瓶颈,设计了多行块通信打包、计算与通信重叠性能优化策略和丢弃非关键元素的低通信复杂性数值优化方法.数值实验结果显示,相较于串行Gauss-Seidel算法,优化后的块Gauss-Seidel/Jacobi算法预处理过程加速比最高可达到4.16倍.以1040核的测试数据为基准,在处理器核数达到33 280时,块Gauss-Seidel/Jacobi预条件算法的并行效率达到61%.
非结构网格、异构众核架构、区域分解算法、块Gauss-Seidel/Jacobi算法、神威太湖之光
42
TP301(计算技术、计算机技术)
国家“九七三”重点基础研究发展规划项目基金2017YFB0202104和2016YFB0200401;国家自然科学基金91530324,91430218,11401580,11701547,11602282和61531166003;深圳市基础研究学科布局项目基金JCYJ20170307165328836,JCYJ20160331193229720和JSGG20170824154458183
2019-12-04(万方平台首次上网日期,不代表论文的发表时间)
共14页
2447-2460