10.16249/j.cnki.2096-4617.2023.01.011
乌梅印刷多字体藏文文本的检测与识别
随着藏文信息处理技术的发展,藏文乌金字体的识别取得了很好的效果,但藏文乌梅字体由于书写风格差异大,检测和识别难,目前的乌梅字体识别仅限于以字丁识别、单一字体为主.近几年随着计算机字体的丰富,出现了乌梅印刷多字体文本.为了准确识别这类文本,文章基于中英文的预训练模型DB-Net开展藏文文本检测,以ResNet-50为骨干网络的CRNN和SRN两种不同编码-解码方式开展端到端的乌梅印刷多字体文本识别,并以实验测试两种模型的识别结果.实验表明,当训练和测试所用字体一致时两个模型的识别效果相当;使用不在训练集中的另外8种乌梅字体进行测试时,SRN识别算法相比CRNN在TCR、TDR和LRA三个评价指标上分别提升0.5363%、1.7681%和3.4875%,表现出更强的泛化能力.
乌梅、多字体、藏文文本、识别
7
TP391.41(计算技术、计算机技术)
国家自然科学基金;西藏大学研究生高水平人才培养计划项目
2023-05-25(万方平台首次上网日期,不代表论文的发表时间)
共9页
92-100