10.3979/j.issn.1673-825X.202001150022
基于特征金字塔网络的自然场景图像文本检测
针对深度学习中对任意形状文本检测准确率不高的问题,提出了一种结合特征金字塔网络(feature pyramid network,FPN)和内核尺度扩展算法的文本检测网络模型.特征金字塔网络能够提取卷积层中更加鲁棒的特征,融合后生成不同尺度的特征内核;内核尺度扩展算法将生成的最小特征内核逐渐扩展为包围完整文本实例的特征图.同时为了针对自然场景中难以检测的文本实例,在训练阶段加入了在线难例挖掘(online hard example mining,OHEM)的方法,并以迁移学习的方式采用2种不同训练策略进行训练.仿真结果表明,该算法模型在不同数据集上具有良好的检测性能.
深度学习;文本检测;特征金字塔;内核扩展
34
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金
2022-03-18(万方平台首次上网日期,不代表论文的发表时间)
共9页
155-163