10.3321/j.issn:0254-4164.2005.08.002
一种针对多媒体扩展指令集和实际多媒体程序的自动向量化方法
自动向量化编译是利用处理器的多媒体扩展指令集提升多媒体程序性能的理想工具.但目前的研究不能有效加速实际程序.其主要原因是:普通算术操作的向量化不一定有性能提升;而多媒体典型操作因为其在源代码中表现形式多样而不能充分向量化.为了解决这一问题,文章对经典向量化算法[1]进行改进以灵活统一地向量化这两类操作.主要的改进是增加了两个步骤:统一操作的不同表现形式和识别有价值的向量化操作.改进后的算法可以充分利用指令集生成高效代码,从而对实际多媒体程序拥有良好效果.此外,该算法可扩展性也很强.
自动向量化编译技术、多媒体扩展指令集、多媒体典型操作
28
TP303(计算技术、计算机技术)
国家自然科学基金60273046;上海市科委资助项目02JC14013;Intel公司大学合作项目
2005-09-15(万方平台首次上网日期,不代表论文的发表时间)
共12页
1255-1266