10.3969/j.issn.1006-8961.2001.10.012
一种快速有效的印刷体文字识别算法
为了利用低成本的硬件来实现对印刷体文字的快速识别,提出了一种基于多级分类的印刷体文字快速识别算法,该算法从预处理、特征提取,到模式匹配各个阶段,都对传统方法作了合理的改进.该算法首先是采用36×36, 而不是传统的48×48点阵进行归一化,从而有效地减少了计算量和字典容量;其次是采用改进的粗外围特征,并进行二重分割,以提高特征的稳定性;最后在各级分类中采用了不同的判别准则,包括绝对值距离、欧氏距离及相似度准则,以适应于时间、准确性的不同要求.同时用该算法对一级汉字7 000个样本进行了实验,其结果表明,实际正确识别率(正识率)达95%,前5位累积正识率可达98%,从而为“电子阅读笔”的开发与研制打下了坚实的理论基础.
印刷体文字识别、多级分类、规范化、粗外围特征、平均线密度
6
TP391.43(计算技术、计算机技术)
陕西省科技研究发展基金
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
1011-1015