10.11896/j.issn.1002-137X.2019.04.050
基于SW26010处理器的FT程序的性能优化
"神威·太湖之光"是中国自主研发的超级计算机,其处理器芯片为国人自主研发的SW26010异构众核处理器,每个处理器内含有4个核组,每个核组包括1个主核和64个从核.N PB-F T程序的功能是利用快速傅立叶变换求解三维偏微分方程,其被广泛用于评测集群的计算和集合能力,因此选用FT程序对"神威·太湖之光"提供的多层次并行资源和体系架构的性能进行测试具有重要的意义.首先,利用加速线程库将程序改写为主从版本,使计算核心能够在从核上执行;其次,利用从核的寄存器通信以及主从核间的数据传输通道,消除FT程序中的数据转置过程;然后,实现了计算与通信隐藏,避免了核间通信时核内的计算资源处于空闲状态;最后,利用向量化和指令流水技术,提升程序的数据级并行和指令级并行.实验结果为:单核上3D-32规模的加速比为66,64核上3D-512规模的加速比为20,256核上3D-2048规模的加速比为46.
傅立叶变换、SW26010处理器、寄存器通信、通信隐藏
46
TP301.6(计算技术、计算机技术)
国家重点研发计划"高性能计算"重点专项2016YFB0200503
2019-05-28(万方平台首次上网日期,不代表论文的发表时间)
共8页
321-328