GPGPU性能模型及应用实例分析

引用

摘要：

现代图形处理器(GPU)的高性能吸引了大量非图形应用,为了有效地进行性能预测和优化,提出一种GPU处理通用计算问题的性能模型.通过分析现代GPU并行架构和工作原理,将GPU的通用计算过程划分为数据获取、计算、输出和传输4个并列的阶段,结合程序特点和硬件规格对各阶段进行量化分析,完成性能预测.通过实验分析得出两大性能影响要素:计算强度和访问密度,并将其作为性能优化的基本准则.该模型被用于分析几种常见的图像和视频处理算法在GPU上的实现,包括高斯卷积、离散余弦变换和运动估计.实验结果表明,通过增大计算强度和访问密度,文中优化方案显著地降低了GPU上的执行时间,使得计算效率提升了4～10倍,充分说明了该模型在性能预测和优化方面的有效性.

关键词：GPU、GPGPU、图像处理、性能模型、DCT、卷积、运动估计

所属期刊栏目：21

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金60573149

在线出版日期：2009-11-03（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：1219-1226

英文信息展示

期刊专题