10.3321/j.issn:1002-8331.2001.20.041
鲁棒的多体印刷英文识别系统的实现
文章讨论了设计一个实用的多体英文识别系统中解决的主要问题.该系统能识别多达260种字体,包括斜体和黑体等字体,对训练集的识别率达到99%,对实际文本测试的错误率比TH-OCR2000低56%.文章详细阐述了文本行字切分,特征提取和分类器设计,以及后处理所使用的常用技术,对各种技术的特点进行了分析和比较,并提出了一些新的技术.文章对于OCR系统的设计具有一定的指导意义.
光学字符识别、字符切、分特征提取、分类器设计、后处理
37
TP391(计算技术、计算机技术)
国家高技术研究发展计划863计划863-306-ZT03-03-1;国家自然科学基金69972024
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
120-122