10.3969/j.issn.1002-7378.2011.04.009
基于多引擎的印刷体汉字识别系统的设计
设计一种基于多引擎的印刷体汉字识别系统,优先采用汉王光学字符识别(OCR)引擎的版面分析结果,在汉王、清华OCR引擎分别完成字符识别之后,根据字符的图像坐标,整合两者的识别结果,并用彩色突出两OCR引擎的冲突字符、置信度低的字符及WiseCheck语义校对引擎提示的错误字符。该系统改善了现有大规模数字化加工生产线中人工比照图像时对识别文本逐字、全文遍历式校对的工作模式,能减轻劳动强度,提高工作效率,降低处理成本。
汉字识别、光学字符识别、语义校对、多引擎
27
TP391.1(计算技术、计算机技术)
2012-04-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
317-319