10.3969/j.issn.1674-1331.2024.01.012
基于多头自注意力机制和PANet的优化YOLOv5行人检测算法
针对行人检测任务中出现拥挤和目标尺寸小所导致的行人检测精度低和效果不佳问题,提出一种基于改进YOLOv5的检测算法.首先,将多头自注意力机制嵌入YOLOv5骨干网络末端,加强了网络对目标行人的全局信息感知,进一步增强了对行人目标可视化区域的特征提取.其次,改进了 PANet结构,使模型可以获取更细粒度的特征图.最后,采用更适合密集场景的Varifocal Loss损失函数代替Focal Loss损失函数,以提高模型的鲁棒性.实验结果表明,相比于YOLOv5模型,改进后的算法mAP@0.5与mAP0.5∶0.95分别提高到90.2%和63%,并且对小尺度行人以及密集行人都表现出更好的检测效果,同时比其他同类主流算法拥有更高的鲁棒性和准确性.
行人检测、YOLOv5、多头自注意力、损失函数
45
TP391(计算技术、计算机技术)
国家自然科学基金62102003
2024-02-23(万方平台首次上网日期,不代表论文的发表时间)
共9页
93-101