面向异构众核从核的数学函数库访存优化方法
数学库函数算法的特性致使函数存在大量的访存,而当前异构众核的从核结构采用共享主存的方式实现数据访问,从而严重影响了从核的访存速度,因此异构众核结构中数学库函数的性能无法满足高性能计算的要求.为了有效解决此问题,提出了一种基于访存指令的调度策略,亦即将访存延迟有效地隐藏于计算延迟中,以提高基于汇编实现的数学函数库的函数性能;结合动态调用方式,利用从核本地局部数据存储空间LDM(local data memory),提出了一种提高访存速度的ldm_call算法.两种优化技术在共享存储结构下具有普遍适用性,并能够有效减少函数访存开销,提高访存速度.实验表明,两种技术分别能够平均提高函数性能16.08%和37.32%.
异构众核、数学函数库、访存优化、指令调度、局部数据存储空间
41
TP311(计算技术、计算机技术)
2014-07-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
12-17