基于多级文本检测的复杂文档图像扭曲矫正算法

引用

摘要：

文档的扭曲矫正是进行文档OCR(Optical Character Recognition)的基础步骤,对提高OCR的准确率有重要作用.文档图像的扭曲矫正常常依赖于文本的提取,然而目前文档图像矫正算法大都无法对复杂文档中的文本进行准确定位和分析,导致其矫正效果不理想.针对此问题,提出了一种基于全卷积网络的文字检测框架,并使用合成文档对网络进行针对性训练,可实现对字符、词、文本行三级文本信息的准确获取,进而对文本进行自适应采样并利用三次函数对页面进行三维建模,将矫正问题转化为模型参数优化问题,达到矫正复杂文档图像的目的.使用合成扭曲文档以及真实测试数据进行矫正实验,结果表明,提出的矫正方法能够对复杂文档进行精确的文本提取,明显改善了复杂文档图像矫正后的视觉效果,相比于其他算法,该算法矫正后OCR的准确率得到显著提高.

关键词：卷积神经网络;文本检测;文档三维建模;文档图像矫正;光学字符识别

所属期刊栏目：48

分类号：TP391(计算技术、计算机技术)

在线出版日期：2021-12-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：249-255

英文信息展示

期刊专题