面向OpenCL模型的GPU性能优化
GPU的高性价比吸引了越来越多的通用计算.为充分发挥异构处理平台下GPU的通用计算能力,提出面向OpenCL模型的性能优化方法.该方法建立源程序的多面体表示,分别对GPU的全局存储器和快速存储器进行优化与分配;通过检测存储访问模式发掘可向量化的存储访问实例,利用数据空间变换对存储访问模式进行转换,进而使用向量数据类型提高片外存储器的带宽利用率;通过检测程序中的数据重用,根据数据的访问属性和OpenCL存储模型的特性实现快速存储器的有效分配与优化,提高了片上存储器的使用效率.采用文中方法对6个测试程序进行实验的结果表明,程序的性能提高了1.6~8.4倍,证实了其有效性.
0penCL、GPU、性能优化、异构处理、通用计算、多面体表示
23
TP391(计算技术、计算机技术)
上海市重点学科建设项目基金B114;AMD大学合作计划基金
2011-07-19(万方平台首次上网日期,不代表论文的发表时间)
共11页
571-581