10.3969/j.issn.1002-137X.2012.06.073
面向异构架构的混合精度有限元算法及其CUDA实现
长期以来,单精度似乎与科学计算无缘,然而从体系结构看,混合精度计算可以充分发挥向量部件、GPGPU设备的单精度性能,提供更高的效能,如降低通讯带宽要求、提高数据传输和通讯效率等.混合精度显格式有限元算法,结合材料强非线性多尺度有限元程序msFEM,实现了GPGPU上的有效加速.实验结果表明:混合精度显格式有限元程序实现了90%以上的计算通过单精度完成,其计算结果与全部使用双精度的结果相一致.该算法可以使得在不支持双精度格式的加速卡上实现科学计算功能.在支持双精度浮点格式的GPU上,混合精度算法与全部采用双精度计算相比其加速效果提高了1.6~1.7倍.
GPGPU、混合精度算法、有限元、并行计算
39
TP391.7(计算技术、计算机技术)
国家自然科学基金11072241
2012-07-31(万方平台首次上网日期,不代表论文的发表时间)
共4页
293-296