10.3969/j.issn.1003-9775.2012.02.009
低质量汉字的分块搜索两级识别法
由于汉字笔画复杂,从视频中提取的汉字图像质量往往较差,采用传统光学字符识别(OCR)的结果不理想.为了解决低质量汉字图像的识别问题,提出一种基于分块搜索的两级识别方法.首先建立汉字图像的分块结构并模仿低质量汉字生成训练集,然后对训练集中各分块图像应用主成分分析提取特征并建立索引.待识别图像应用分块搜索和投票的方式从索引中获取候选汉字集合(一级识别),再根据投票结果的显著性辅以全局结构特征匹配识别汉字(二级识别).实验结果证明,该方法对于低质量汉字图像比普通的OCR方法具有更高的识别率.
光学字符识别、低质量汉字识别、分块搜索、多级识别
24
TP391(计算技术、计算机技术)
国家"九七三"重点基础研究发展计划项目2007CB311100;国家"八六三"高技术研究发展计划2009AA01A403;国家自然科学基金60802028;北京市科技新星计划项目2007B071;北京市教育委员会共建项目专项
2012-04-27(万方平台首次上网日期,不代表论文的发表时间)
共6页
170-175