10.3963/j.jssn.1674-4861.2024.02.007
基于改进YOLOv7的码头作业人员检测算法
广角监控图像中人员目标检测对于码头智能安防具有重要意义.针对传统YOLOv7算法在码头广角监控图像识别中,存在小目标特征提取能力弱、人员检测准确率低等问题,研究了基于改进YOLOv7的码头作业人员检测算法.为提升人员目标多尺度特征的检测性能及鲁棒性,设计了平衡码头人员分类与定位任务的上下文解耦(task-specific context decoupling,TSCODE)结构并联合聚集-分发机制(gather-and-distribute,GD),增强网络多尺度特征融合能力;为增强网络对作业人员等小目标的特征提取能力,在主干网络末端引入了基于双层路由注意力机制(bi-level routing attention,BRA)的视觉transformer模型(BRA-ViT),捕捉小目标人员的位置、方向与跨通道等信息;为提升检测速度并保持检测精度,提出了基于slim-neck的颈部层网络轻量化方法,降低参数量与计算量;为降低漏检率与误检率,引入了基于最小点距离的交并比损失函数(mini-mum-point-distance-based intersection over union,MPDIoU)计算边界框的坐标预测损失,提升边界框回归的准确性与计算效率.为验证算法效果,采集白天、夜晚不同时段下码头前沿、堆场、卡口等场景的广角监控图像,构造标注数据集并设计消融与对比实验.实验结果显示:所提算法对码头作业人员检测的平均准确率为90.6%,平均检测速度为39 fps;与Faster R-CNN、SSD、YOLOv3、YOLOv5、YOLOv7、YOLOv8等算法相比,其平均准确率分别提升了13.8%、15.8%、8.5%、5.2%、2.7%和3.5%,平均检测速度与基准YOLOv7算法性能相当.所提算法对码头作业人员识别具有较高的检测精度与检测速度,满足码头安防场景中作业人员检测准确性与实时性的要求.
交通安全、广角监控图像、码头作业人员检测定位、YOLOv7
42
TP391.4;U698.5(计算技术、计算机技术)
国家科技重大专项2022ZD0119303
2024-09-10(万方平台首次上网日期,不代表论文的发表时间)
共9页
67-75