面向驾驶场景的多尺度特征融合目标检测方法

引用

摘要：

针对驾驶场景中目标检测卷积神经网络模型检测精度较低的问题,提出一种基于改进RefineDet网络结构的多尺度特征融合目标检测方法.在RefineDet网络结构中嵌入LFIP(Light-weight Featurized Image Pyramid,轻量级特征化的图像金字塔)网络,将LFIP网络生成的多尺度特征图与RefineDet中的ARM(Anchor Refinement Module,锚点框修正模块)输出的主特征图相融合,提升特征层中锚点框初步分类和回归的输出效果,为ODM(Object Detection Module,目标检测模块)模块提供修正的锚点框以便于进一步回归和多类别预测;在RefineDet网络结构中的ODM之后嵌入多分支结构RFB(Receptive Field Block,感受野模块),在检测任务中获得不同尺度的感受野以改善主干网络中提取的特征.将模型中的激活函数替换为带有可学习参数的非线性激活函数PReLU(Parametric Rectified Linear Unit,参数化修正线性单元),加快网络模型的收敛速度;将RefineDet的边界框回归损失函数替换为排斥力损失函数Repulsion Loss,使目标检测中的某预测框更靠近其对应的目标框,并使该预测框远离附近的目标框及预测框,可以提升遮挡情况下目标检测的精度;构建驾驶视觉下的目标检测数据集,共计48260张,其中38608张作为训练集,9652张作为测试集,并在主流的GPU硬件平台进行验证.该方法的mAP为85.59％,优于RefineDet及其他改进算法;FPS为41.7 frame/s,满足驾驶场景目标检测的应用要求.实验结果表明,该方法在检测速度略微下降的情况,能够较好地提升驾驶视觉下的目标检测的精确度,并能够一定程度上解决驾驶视觉下的遮挡目标检测和小目标检测的问题.

关键词：深度学习、卷积神经网络、目标检测、RefineDet算法、感受野模块(RFB)、轻量级特征化的图像金字塔(LFIP)、参数化修正线性单元(PReLU)、损失函数、遮挡目标

所属期刊栏目：57

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金;广东省自然科学基金重点项目;广东省重点科技领域研发计划

在线出版日期：2021-07-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：134-141

英文信息展示

期刊专题