10.16652/j.issn.1004-373x.2022.02.001
基于嵌入式FPGA的航拍目标检测解决方案
低空航拍视角往往背景复杂、目标小而多,难以检测识别,实际飞行器又有低延时和高处理速度的要求.针对该应用场景,文中提出完整的嵌入式FPGA解决方案,多种技术模块化协同地实现深度学习应用的高效部署.由飞行器定向采集制作数据集,基于SSD优化深度学习网络框架;通过高层次综合的方式设计辅助计算核,并定制DPU加速核,共同组成硬件平台,由Vitis工具链统合编译生成嵌入式操作系统镜像;基于Vitis AI技术生成网络推断函数库,基于OpenCL技术设计高层次综合硬件调度函数库,以动态链接库的方式兼容于基于Python设计的多线程主机应用程序中.测试结果表明,测试集上的均值平均精度(mAP)为0.55,实时处理速度约为20 f/s.文中方案在指标上满足了应用需求,并且可推广至其他深度学习的嵌入式部署设计.
目标检测;嵌入式FPGA;深度学习;高层次综合;硬件加速;精确检测
45
TN911.23-34
国家自然科学基金;武汉市应用基础前沿项目
2022-02-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
1-6