多图形处理器上Lattice-Boltzmann方法的加速
为了提高计算流体领域中复杂流动现象模拟计算的高效性和准确性,充分利用图形硬件的并行性,提出一种在单机多图形处理器下基于CUDA架构的Lattice Boltzmann方法(LBM)的模拟算法.采用区域划分策略将域上的LBM网格平均分配到不同的GPU设备上,在分区边界处搭接一层网格以方便计算该处网格的迁移过程,减少GPU间的通信量,并合理地利用CUDA存储层次架构中的全局内存和纹理内存为计算网格分配设备空间;采用多线程技术,用每个线程控制不同的GPU设备,同时引入线程同步机制信号量实现线程间的数据通信同步控制,按照LBM方程组的求解过程实现模拟计算.实验结果表明,双GPU将计算加速到单GPU的1.77倍左右,同时将流场计算网格规模从单GPU下的4160×4160扩大到双GPU下的6144×6144.
CUDA、多线程技术、Lattice Boltzmann方法、多图形处理器、信号量、并行计算
22
TP391.9(计算技术、计算机技术)
国家自然科学基金10902087;航天科技创新基金2009200066
2011-01-28(万方平台首次上网日期,不代表论文的发表时间)
共8页
1932-1939