10.3969/j.issn.1671-0673.2023.01.009
面向申威异构众核处理器的矩阵乘分块参数模型
针对矩阵乘计算的编译优化,解决了由于申威异构众核处理器复杂体系结构及存储层次导致的程序优化难问题,过程中循环分块参数对于程序的优化效果极为重要.基于申威最新一代SW26010-Pro异构众核处理器提出了矩阵乘计算分块参数模型,旨在为矩阵乘计算编译优化的计算分解提供分析模型支撑.模型通过对申威处理器上的存储空间及数据传输过程进行分析,能够确定最优循环分块参数,并对数据传输时间及程序执行时间做出预测.测试证明模型能够在存储空间限制条件下得到最优循环分块参数,且程序执行时间预测平均准确率达到 了 96.87%.
异构众核处理器、矩阵乘计算、分块参数、分析模型
24
TP314(计算技术、计算机技术)
国家自然科学基金61702546
2023-04-28(万方平台首次上网日期,不代表论文的发表时间)
共7页
65-71