10.3772/j.issn.1002-0470.2021.05.003
基于NVDLA与FPGA结合的神经网络加速器平台设计
随着深度神经网络对算力的需求不断增加,传统通用处理器在完成推理运算过程中出现了性能低、功耗高的缺点,因此通过专用硬件对深度神经网络进行加速逐步成为了深度神经网络的重要发展趋势.现场可编程门阵列(FPGA)具有重构性强、开发周期短以及性能优越等优点,适合用作深度神经网络的硬件加速平台.英伟达深度学习加速器(NVDLA)是英伟达开源的神经网络硬件加速器,其凭借自身出色的性能被学术界和工业界高度认可.本文主要研究NVDLA在FPGA平台上的优化映射问题,通过多种优化方案高效利用FPGA内部的硬件资源,同时提高其运行性能.基于搭建的NVDLA加速器平台,本文实现了对RESNET-50神经网络的硬件加速,完成了在ImageNet数据集上的图像分类任务.研究结果表明,优化后的NVDLA能显著提高硬件资源使用效率,处理性能最高可达30.8fps,实现了较边缘中央处理器(CPU)加速器平台28倍的性能提升.
英伟达深度学习加速器(NVDLA)、现场可编程门阵列(FPGA)、硬件加速、模块优化
31
TP393;F626.5;TN912.34
中国科学院战略性先导科技专项XDB32000000
2021-06-23(万方平台首次上网日期,不代表论文的发表时间)
共10页
479-488