10.3969/j.issn.1002-137X.2006.08.061
文档处理中背景字符的去除
识别域图像的提取是文档自动处理系统中一个重要的预处理过程.在实际应用中,用户填写的信息常常与版面中的框线和背景字符存在交叠现象,严重影响了系统的性能.本文提出了基于点边距离分析的背景字符去除算法.首先通过灰度图像匹配的方法精定位背景字符子图像;然后利用形态学方法结合笔画的宽度信息对背景字符子图像进行二值化;最后分析像素点到边界距离的变化确定需要填充的像素位置,并通过形态学方法计算像素的填充值.实验采用了真实票据图像中的日期域,实验结果表明本文的方法获得了基本令人满意的效果,背景字符像素被成功去除.
图像处理、文档图像分析、图像匹配、二值化、数学形态学
33
TP3(计算技术、计算机技术)
电子信息产业发展基金信部运[2003]446号
2006-09-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
229-231