10.6041/j.issn.1000-1298.2020.08.037
基于语义分割的食品标签文本检测
食品包装上的标签文本含有生产日期、营养成分、生产厂家等食品相关信息,这些不仅为消费者购买食品提供了重要依据,也有助于食品监督抽检机构发现潜在的食品安全问题.食品标签文本检测是食品标签自动识别的前提,有助于降低人工录入成本、提高数据处理效率.基于食品包装图像构建数据集,提出了一种基于语义分割的距离场模型,以检测食品标签.该模型包含像素分类和距离场回归两类任务,其中像素分类任务分割处理图像中的文本区域,距离场回归任务预测文本区域内的像素点到该区域边界的归一化距离.为提升模型的检测性能,在回归预测模块中通过增加注意力模块优化模型结构,并针对距离场回归任务损失值过小、影响模型训练优化问题对其损失函数进行了改进.消融实验结果表明,增加注意力模块和损失函数的改进使得模型的准确率分别提高了4.39、3.80个百分点,有效提高了检测准确率.食品包装图像数据集的对比实验表明,采用本文模型检测食品标签文本具有较好的性能,其召回率、准确率分别达到87.61%、76.50%.
食品标签、语义分割、文本检测、文本识别
51
TP391.1(计算技术、计算机技术)
国家重点研发计划项目2018YFC1603305、2018YFC1603302
2020-09-21(万方平台首次上网日期,不代表论文的发表时间)
共8页
336-343