基于定点压缩技术的双层粒子网格算法的设计与优化
现代天体物理学的研究离不开大规模N-body模拟.N-body模拟常用的算法之一是粒子网格(Particle-Mesh,PM)算法,但是PM算法需要消耗较多的内存容量.内存限制成为了N-body模拟在现代超算平台大规模扩展的瓶颈.因此,文中使用了利用定点压缩技术减少内存消耗的方法,将存储每个N-body粒子相空间的内存消耗减少到最低6个字节,比传统PM算法低近一个数量级.文中实现了基于定点压缩技术的双层粒子网格算法,并使用包括混合精度计算、通信优化在内的方法对其性能进行了优化.这些优化技术显著降低了定点压缩带来的性能损耗,将压缩和解压在程序总耗时中的占比从21% 降低至8%,并且在核心计算热点上达到了最高2.3倍的加速效果,使得程序在较低的内存消耗下保持较高的计算效率和扩展性.
N-body模拟、粒子网格算法、混合精度计算、大规模并行
47
TP391(计算技术、计算机技术)
国家重点研发计划2016YFB0201800,2018YFA0404603
2020-08-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
56-61