零部件光学影像精准定位的轻量化深度学习网络
光学影像精准定位是提高工业生产效率和质量的重要环节.传统图像处理定位方法由于光照、噪声等环境因素的影响,在复杂场景下定位精度低、易受干扰;而经典深度学习网络虽然在自然场景目标检测、工业安检、抓取、缺陷检测等得到了广泛应用,但是其海量数据的训练需求、复杂系统的深度学习大模型、检测框的冗余及不精确等问题,导致它不能直接应用于工业零部件像素级精准定位.针对以上问题,构建了一种零部件光学影像像素级精准定位的轻量化深度学习网络方法.网络总体选用Encoder-Decoder架构,Encoder使用三级bottleneck级联,在降低特征提取参变量的同时充分提升了网络的非线性;Encoder与Decoder对应特征层实施融合拼接,促使Encoder在上采样卷积后可以获得更多的高分辨率信息,进而更完备地重建出原始图像细节信息;最后,利用加权的Hausdorff距离构建了 Decoder输出层与定位坐标点的关系.实验结果表明:轻量化深度学习定位网络模型参数为57.4 kB,定位精度小于等于5 pixel的识别率大于等于99.5%,基本满足工业零部件定位精度高、准确率高和抗干扰能力强等要求.
机器视觉、光学影像、深度学习、精准定位、轻量化
31
TP391.4(计算技术、计算机技术)
国家自然科学基金;国家重点研发计划
2023-11-13(万方平台首次上网日期,不代表论文的发表时间)
共15页
2611-2625