GRAPES_CUACE大气化学耦合模式并行优化
文中主要介绍了数值天气预报模式GRAPES_MESO(4.0版本)与大气化学模式CUACE在线耦合形成的GRAPES_CUACE大气化学耦合模型在不同版本的x86体系结构下的并行优化算法的研究与分析.借鉴目前国内外主流的并行优化设计方法,结合GRAPES_MESO系统本身的程序架构和并行框架,针对不同版本x86体系架构做了相应的并行化改造.运用gprof工具和戳桩计时等方法,测试得到的程序热点模块主要有3部分:IO、通信和物理过程.对IO模块主要的优化方法为:1)由离散读写改为连续读写;2)开辟缓冲区由稀疏访存改为连续访存;3)异步IO.对通信部分采用两种方式:1)由细粒度改为粗粒度通信;2)采用时间复杂度更低的集合通信.对IO与通信模块优化结果分析可得:IO模块优化后的耗时占比由原来的43.7%降至1.41%,比重大幅度降低,最优部分性能提升了317倍,因此,该方法极大地提升了IO模块运行效率.此外,对物理过程进行优化采用的主要方法是:1)多层循环计算过程由离散改为连续;2)通信机制循环外移;3)数据复用以减少计算冗余;4)缩减栈变量空间等.这些优化方法使计算性能提高了22%,进一步提高了程序的并行效率和模式的强可扩展性.
异步IO、粗粒度、连续访存、集合通信
46
TP302.7(计算技术、计算机技术)
国家重点研发计划2016YFC0203300;国家重大专项基金2016YFA0602202,2017YFB0202603
2019-12-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
528-534