卷积神经网络的多字体汉字识别

引用

摘要：

目的多字体的汉字识别在中文自动处理及智能输入等方面具有广阔的应用前景,是模式识别领域的一个重要课题.近年来,随着深度学习新技术的出现,基于深度卷积神经网络的汉字识别在方法和性能上得到了突破性的进展.然而现有方法存在样本需求量大、训练时间长、调参难度大等问题,针对大类别的汉字识别很难达到最佳效果.方法针对无遮挡的印刷及手写体汉字图像,提出了一种端对端的深度卷积神经网络模型.不考虑附加层,该网络主要由3个卷积层、2个池化层、1个全连接层和一个Softmax回归层组成.为解决样本量不足的问题,提出了综合运用波纹扭曲、平移、旋转、缩放的数据扩增方法.为了解决深度神经网络参数调整难度大、训练时间长的问题,提出了对样本进行批标准化以及采用多种优化方法相结合精调网络等策略.结果实验采用该深度模型对国标一级3 755类汉字进行识别,最终识别准确率达到98.336％.同时通过多组对比实验,验证了所提出的各种方法对改善模型最终效果的贡献.其中使用数据扩增、使用混合优化方法和使用批标准化后模型对测试样本的识别率分别提高了8.0％、0.3％和1.4％.结论与其他文献中利用手工提取特征结合卷积神经网络的方法相比,减少了人工提取特征的工作量;与经典卷积神经网络相比,该网络特征提取能力更强,识别率更高,训练时间更短.

关键词：汉字识别、卷积神经网络、深度学习、数据扩增、批标准化

所属期刊栏目：23

分类号：TP391.1(计算技术、计算机技术)

资助基金：国家自然科学基金项目21227008;吉林省重点科技攻关项目20170204035GXNational Natural Science Foundation of China21227008

在线出版日期：2018-04-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：410-417

英文信息展示

期刊专题