10.3969/j.issn.1671-1815.2019.31.030
开放式计算语言加速的分段前缀和并行算法
针对数值计算中前缀和运算数据量大、耗时巨大这一难题,提出了一种基于开放式计算语言(open computing lan-guage,OpenCL)的分段式前缀和并行算法.首先进行了分段式前缀和算法的并行性分析,对任务进行了层次化分解与组合,设计了两级并行的分段式前缀和算法;然后通过OpenCL编程将前缀和并行算法映射到CPU+GPU系统平台上,实现了层次化并行前缀和处理;最后,根据计算单元(compute unit,CU)的资源条件,增加CU中本地存储器的分配,通过改进工作节点的访问模式来降低bank冲突,提高访存速度.实验结果表明,与基于AMD Opteron 2439 SE CPU的串行算法、基于OpenMP(open multi-processing)并行算法和基于统一计算设备架构并行算法性能相比,前缀和并行算法在OpenCL架构下NVIDIA Tesla C2075计算平台上分别获得了33.51倍、6.26倍和2.41倍的加速比.验证了提出的并行优化方法的有效性和性能可移植性.
分段式前缀和、图形处理器、开放式计算语言、并行算法、性能优化
19
TP311(计算技术、计算机技术)
国家自然科学基金61572444、41601496、41701525;山东省自然科学基金ZR2017LD002;山东省重点研发计划项目2018GGX106002
2019-12-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
215-221