10.3772/j.issn.1002-0470.2022.03.003
基于FPGA的视频实时目标检测方法研究
针对实时目标检测网络在图形处理器(GPU)加速器上实时性低、功耗高和成本高等问题,本文提出了一种结合通道注意力机制与深度可分离卷积的神经网络模型(AtDS-SSD),并将该网络在现场可编程门阵列(FPGA)上进行优化与部署.AtDS-SSD网络在SSD模型基础上,将VGG 16特征提取网络部分替换成以深度可分离卷积为主体的MobileNet网络,并加入通道注意力模块.本文采用8位的定点量化方法,对网络模型参数进行量化.最后,本文将量化后的AtDS-SSD网络模型在ZCU 102平台上进行部署,并采用PASCAL VOC数据集进行测试.在平均精度均值只损失0.58%的情况下,加速器性能从85 fps提升到311.7 fps,测试功耗相当于NVIDIA RTX 2080Ti的11%.实验数据表明,基于FPGA平台结合注意力机制和深度可分离卷积的网络模型,可以提升计算实时性并降低功耗,减少网络复杂度降低导致的精度损失,从而验证了本文方法的有效性.
SSD网络、通道注意力机制、深度可分离卷积、现场可编程门阵列(FPGA)、定点量化
32
TP391;TN911.73;TP183
国家自然科学基金;浙江省自然科学基金;浙江省属高校基本科研业务费专项资金资助项目
2022-05-11(万方平台首次上网日期,不代表论文的发表时间)
共9页
239-247