10.3969/j.issn.1671-1815.2014.07.048
拟极小残差法在GPU上的优化研究
随着GPU在高性能计算领域更多地用于科学计算,采用GPU技术对大型稀疏线性方程组进行计算,从而满足人们对计算速度和计算精度要求的提高.NVIDIA Fermi架构的开发,大大提升了GPU的双精度浮点运算能力.拟极小残差法(QMR)作为高性能计算领域中的重要迭代算法,基于求解稀疏代数方程组对ELL算法进行GPU优化.通过对不同规模线性方程组计算分析表明,QMR-GPU的性能提升为原始QMR的3.5倍,与传统的BICG法相比,QMR并行算法具有速度和存储优势,可获得良好的并行加速比.
并行计算、拟极小残差法、统一计算设备架构
14
TP311(计算技术、计算机技术)
国家自然科学基金U1262206
2014-07-04(万方平台首次上网日期,不代表论文的发表时间)
共4页
219-222