10.3772/j.issn.1002-0470.2022.03.002
面向目标检测的卷积神经网络优化方法
针对星载等功耗受限平台下遥感影像目标检测存在的高准确率、低功耗以及高吞吐量等要求,本文提出了一种面向目标检测的现场可编程门阵列(FPGA)卷积神经网络(CNN)优化方法.采用数据流调度技术以及基于乘法矩阵与前向加法链的卷积计算阵列设计对浮点卷积神经网络模型进行加速.利用该方法在FPGA开发板上实现了浮点卷积目标检测网络,在应用中达到了与原模型一致的准确率,平均准确率为97.59%,吞吐量达到了Titan X的22倍.与同类的FPGA加速浮点卷积方法对比,该方法的吞吐量以及能效比达到了最优.实验数据表明,该方案突破了浮点卷积加速的线速吞吐难点,解决了应用中存在的功耗、准确率以及吞吐量三者制衡的问题.
卷积神经网络(CNN)、现场可编程门阵列(FPGA)、数据流调度、目标检测、加速
32
TP391.4;TP181;TN919.8
国家自然科学基金;国家重点研发计划;国家重点研发计划;国家重点研发计划
2022-05-11(万方平台首次上网日期,不代表论文的发表时间)
共12页
227-238