一种基于OPENACC指令的加速体验
随着越来越多的公司和企业使用GPU来作为加速计算设备,对并行程序的需求也越来越大,目前我们一般都使用CUDA或OPENCL等底层API进程序开发,但是使用这些底层API来进行开发效率都不高,目前出现OPENACC指令就是针对这个问题提出来的,在该文里,我们针对高斯模糊算法,分别使用CPU,OPENACC,CUDA进行实现,比较他们的效率,发现在虽然OPENACC 相对于CUDA 性能要低一些,但相对其陡峭的学习曲线和低下的开发效率,OPENACC 有着不错的性价比,而且随着编译器和硬件技术的发展,OPENACC有着广阔的发展空间.
OPENACC、CUDA、GPGPU、卷积
TP391(计算技术、计算机技术)
2013-01-22(万方平台首次上网日期,不代表论文的发表时间)
共3页
8248-8250