10.3969/j.issn.1003-9767.2015.18.020
基于跳变检测和Tesseract的机打发票识别算法
传统的特定发票识别系统,只能针对某一种样式的特定发票进行识别,发票的样式、大小、种类不能有任何变化,否则将不能识别.针对这种情况提出一种新的机打发票识别算法,通过图像处理算法自动定位文字和条款项,并通过支持超大汉字集合的Tesseract-OCR识别引擎与神经网络相结合,识别出发票条款项的具体内容.这种方法可以自动定位文字位置和识别内容项,可以适应一定的发票样式、大小和字体变化,更具有通用性.
跳变检测、神经网络、Tesseract-OCR
TP3(计算技术、计算机技术)
2015-10-28(万方平台首次上网日期,不代表论文的发表时间)
共3页
43-45