10.3772/j.issn.1002-0470.2022.04.001
基于软硬件协同加速的关系网络推理优化方法
针对数据中心基于图形处理器(GPU)平台的关系网络推理计算中存在的低效能问题,本文提出了一种基于软硬件协同加速的关系网络优化方法.该方法采用基于GPU提取的支持集特征池与现场可编程门阵列(FPGA)推理异构协同的方式处理关系网络的推理计算,在高效能计算的同时保持关系网络的推理计算与GPU平台一致的准确率.利用基于高级综合(HLS)优化浮点卷积神经网络的计算方式,提高关系网络的处理能效.利用多运算单元异构多核处理的方式,满足FPGA时序收敛的同时,提升FPGA片上吞吐能力.本文在FPGA平台上实现了关系网络推理运算单元,在Omniglot数据集上构建的加速器功耗为15.867 W,相对于GPU加速比为1.4~17.2;在miniImageNet数据集上构建的加速器功耗为12.359 W,相对于GPU加速比为1.5~3.4.本文方法与同类FPGA加速浮点卷积神经网络相比,达到了最优的计算效能.实验数据表明,该方法有效利用了软硬件协同计算以及FPGA可重构计算的优势,降低了软硬件协同开发的耦合度,在保持关系网络推理计算准确率的同时,提升了关系网络推理的计算效能.
关系网络、软硬件协同加速、卷积神经网络、异构多核
32
TP391;TP181;R318
国家自然科学基金;国家重点研发计划;国家重点研发计划;国家重点研发计划
2022-06-22(万方平台首次上网日期,不代表论文的发表时间)
共10页
327-336