10.16652/j.issn.1004-373x.2023.06.029
面向AI芯片的轻量级目标检测算法研究
目标检测网络层数越多、参数规模越大,其精度越高,但对于低算力的边缘端AI芯片来说,部署超大规模参数量的网络,无法达到实时性的要求.为此,文中基于YOLOv5,提出一种面向AI芯片的轻量化的YOLOv5_RepVGG目标检测算法.首先对YOLOv5的骨干网络进行改进,设计RepVGG_X模块结构,在训练时通过3×3卷积、1×1卷积和直连三种分支结构提取图像特征;在网络推理时通过结构重参数化将1×1卷积和直连与3×3卷积进行融合,最终形成一个3×3的单分支结构.然后对YOLOv5的输出层进行改进,充分利用骨干网络中6次降采样的多尺度信息,输出4种尺度的特征图.最后将设计的轻量化网络部署在国产AI芯片Hi3559AV100上并进行验证.实验结果表明,与传统YOLOv5相比,当网络精度仅下降3个点时,所提算法在AI芯片上的推理时间降到18.6 ms,速度提升近1倍,可满足日益增长的边缘场景AI计算任务实时性的要求.
目标检测、AI芯片、骨干网络、Hi3559AV100、轻量化模型、边缘计算、单分支结构、结构重参数化
46
TN911.23-34;TP391.4
2023-03-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
169-174