10.3969/j.issn.1002-137X.2011.05.072
SIMD数据置换操作的自动生成和优化
SIMD指令能够高效开发数据级并行,因此当前绝大多数通用微处理器都支持这种机制.但是应用程序和算法的一些固有特性,如访存地址不对齐、非连续存储访问以及控制流等,使得编译器或程序员必须借助置换指令重新组合向量的各个元素,才能得到符合SIMD指令要求的操作数.这些冗余的置换指令已成为当前挖掘数据级并行的主要性能瓶颈.提出一种自动的数据置换指令生成和优化算法,以有效地减少置换指令带来的性能损失.该算法基于提出的一种新中间表示形式,其中包含有足够的操作数地址信息,因此可以将置换指令的生成转换为数据流图中冲突边的识别问题,而将置换指令的优化转化为用最少的置换指令来删除所有冲突边的问题.面向一组典型多媒体程序进行测试的结果表明,提出的算法可平均获得7%的性能加速.
数据置换、中间表示、冲突边
38
TP314(计算技术、计算机技术)
国家"973"重点基础研究发展计划2007CB310901;国家自然科学基金项目60803041
2011-09-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
290-294