DOI：10.11784/tdxbz202203031

基于错误纠正模块的场景文本识别算法

引用

摘要：

近年来,场景文本识别技术得到了飞速发展.然而,由于不规则场景文本图像中经常存在诸如杂物遮挡、分布扭曲、光照不足等视觉障碍,使得现有方法不能对单词中某些字符进行准确识别,进而产生较多的错误识别.为了解决这一问题,本文提出了一种基于错误纠正(error correction,EC)模块的场景文本识别算法.与现有算法中的纠错模块不同,所提出的EC模块是一个序列到序列的预测模型.在EC模块的编解码结构中增加了多单元注意力机制,能够更加关注特征图中的一些重要信息.EC模块可直接从纯文本中学习语义信息,用于纠正拼写错误的文本.此外,提出了一种基于场景文本识别的多特征(multi-feature,MF)提取器,该提取器由5个MF单元组成,可分别从Resnet-45后5个模块的输出中提取特征信息.与传统的方法相比,MF提取器可以从不同深度挖掘更加丰富的图像信息.在7个数据集上的对比实验结果表明,与当前先进方法相比,所提算法在性能上具有明显的优势.

关键词：场景文本识别、语义信息纠错、多特征提取、深度学习

所属期刊栏目：56

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金62171314

在线出版日期：2023-03-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：400-407

英文信息展示

期刊专题