注意力监督策略下的自然场景文本检测算法
已有的场景文本检测算法在处理任意形状的文本区域时,会将多余的背景区域也包含在内,为了自动学习聚焦任意形状的文本区域,提出一种注意力监督策略下的文本检测算法.首先使用深度残差网络作为骨架网络提取包含多尺度信息的特征图,然后通过注意力掩膜生成模块将融合特征图转换生成注意力掩膜,再通过背景抑制模块,利用注意力掩膜监督生成下一级特征图,最后经过一系列卷积操作生成分割掩膜,处理优化后得到最终的文本检测结果.实验表明,所提算法在ICDAR2015数据集上的多指标综合表现优越,其中F值相较对比算法提高了2.1%.
场景文本检测、任意形状、背景抑制、注意力监督、分割掩膜
34
TP391.41(计算技术、计算机技术)
国家重点研发计划;浙江省重点研发计划;浙江省自然科学基金
2022-08-01(万方平台首次上网日期,不代表论文的发表时间)
共9页
1011-1019