10.16157/j.issn.0258-7998.190318
基于FPGA的深度学习目标检测系统的设计与实现
针对当前深度学习目标检测算法计算复杂度高和内存需求大等问题,设计并实现了一种基于FPGA的深度学习目标检测系统.设计对应YOLOv2-Tiny目标检测算法的硬件加速器,对加速器各模块的处理时延建模,给出卷积计算模块的详细设计.实验结果表明,与CPU相比,CPU+ FPGA的异构系统是双核ARM-A9能效的67.5倍,Xeon的94.6倍;速度是双核ARM-A9的84.4倍,Xeon的5.5倍左右.并且,当前设计在性能上超过之前的工作.
深度学习、目标检测、FPGA、硬件加速器
45
TP391(计算技术、计算机技术)
2019-08-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
40-43,47