10.3969/j.issn.1002-5057.2021.04.010
中文文字图片同色长干扰线的去除算法
现实环境下所需识别的文字图片存在大量干扰信息,往往和字体颜色相近的同色信息较难除去,从而导致光学字符识别识别率降低的问题.针对文字图像中去除同色且不规则长干扰线的问题,本文提出了一种中文文字图片长干扰线去除方法,旨在剔除待识别文本图片中,复杂干扰线部分的干扰和影响,进而提升光学字符识别识别率.该方法通过扫描待测点通过贪婪算法获得线段权值的方法,设定阈值判别是否与文字粘连的情况,后通过像素级领域特征对文字图片中的干扰像素点进行去除.通过实验证明,该方法针对不规则同色干扰线下的修复能力有着较强鲁棒性和有效性.
光学字符识别;同色长干扰;图像修复;邻域特征
2021-09-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
42-46