消除背景噪声增强字符形状特征的场景文字识别
为了解决现有方法未有效地消除背景噪声和字符自身噪声干扰的问题,提出一种包含3个模块的消除背景噪声增强字符形状特征(EBEC)的文字识别模型.空间注意力机制增强的EBEC网络只关注字符区域特征,以消除背景噪声,迫使网络仅学习字符形状特征,增强字符形状特征;特征提取模块采用EfficientNet-B3作为主干网络提取特征图;基元表征学习模块学习特征图得到视觉文字表征,通过对视觉文字表征解码得到识别结果.实验结果表明,与经典模型相比,所提模型在合成场景数据集上识别准确率提高9.76个百分点,在公开数据集ⅢT5K,ICDAR-2003,ICDAR-2015,CUTE80上识别准确率平均提高2.91个百分点;该模型可有效地消除背景噪声和字符自身噪声,提高识别性能.
场景文字识别、空间注意力机制、背景噪声、字符自身噪声
36
TP391.41(计算技术、计算机技术)
国家重点研发计划;陕西省科技计划重点产业创新链群项目;西安市科技计划科技创新引导项目
2024-09-09(万方平台首次上网日期,不代表论文的发表时间)
共9页
875-883