10.3778/j.issn.1002-8331.2106-0411
深度学习在场景文字识别技术中的应用综述
随着深度学习技术在计算机视觉领域的发展,场景文本检测与文字识别技术也有了突破性的进展.受到自然场景下极端光照、遮挡、模糊、多方向多尺度等情况的影响,无约束的场景文本检测与识别仍然面临着巨大的挑战.从深度学习的角度对场景文本检测和文字识别技术进行深入研究,总结出在文本检测技术中将基于分割的方法与回归的方法优势相结合,可以解决小文本区域的召回率较低的问题,同时适应多尺度文本;在文本识别方法中将CTC机制与Attention机制相结合,可以相互监督以提升识别性能,降低长文本识别的出错率.
深度学习;计算机视觉;自然场景;文本检测;文字识别
58
TP391.1(计算技术、计算机技术)
国家自然科学基金;黑龙江省教育厅基本科研业务费科研项目
2022-03-03(万方平台首次上网日期,不代表论文的发表时间)
共12页
52-63