面向CGRA循环流水映射的数据并行优化
数据密集型应用中的核心循环消耗了程序的大量执行时间.如何实现核心循环在粗粒度可重构体系结构(CGRA)上的有效映射仍是当前研究领域的难点.为了在CGRA上最大程度开发应用并行性,降低循环访存开销,提高硬件资源利用率,文中提出一种新颖的面向CGRA循环流水映射的数据并行优化方法.通过定义一种新的可重构计算模型TMGC2以实现对循环的多条数据流水线并行加速.为避免并行化执行带来的额外存储体冲突问题影响CGRA执行性能,为后续循环映射创造良好的数据条件,引入存储体消除策略对数据进行重组,并结合数据重用图实现数据并行优化.实验表明,采用文中方法对已有CGRA循环流水映射方法进行优化,可以提高37.2%的数据吞吐量及41.3%的资源利用率.
可重构计算、数据密集型应用、数据重组、数据重用、循环映射、粗粒度可重构体系结构
36
TP302(计算技术、计算机技术)
国家自然科学基金61076020;This paper is partly supported by the National Natural Science Foundation of China under project "Research of Coarse-grained Reconfigurable SoC based on Programmable Dataflow Computing"with grant No.61076020
2013-10-10(万方平台首次上网日期,不代表论文的发表时间)
共10页
1280-1289