期刊专题

10.3979/j.issn.1673-825X.202002160046

结合特征融合和金字塔注意力的场景文本检测

引用
基于深度学习的场景文本检测普遍缺少特征级的精细化,导致原本设计良好的模型不能被充分利用,提出将特征融合和特征金字塔注意力模块应用到场景文本检测.将基本特征提取网络(PixelLink算法)得到的4个特征映射层以采样后加权叠加的方式进行特征融合,并将结果送给特征金字塔注意力模块.特征融合使各层级的特征信息相结合,从而增加了特征映射层的信息量.采用注意力网络可以在增大感受野的同时不提高计算力,而空间金字塔结构可利用不同的网格尺度或不同的扩张率融合多尺度的特征信息.特征金字塔注意力模块包含精细化金字塔网络分支、非线性变换分支以及全局平均池化分支.实验结果表明,相较于PixelLink算法,该算法在IC-DAR2015和ICDAR2013数据集上综合指标(F-measure,F)分别提升了2.91%和4.04%.

特征融合;特征金字塔注意力模块;自然场景文本检测;PixelLink;ICDAR2015;ICDAR2013

34

TP391(计算技术、计算机技术)

辽宁省教育厅科学研究项目JDL2019006

2022-03-18(万方平台首次上网日期,不代表论文的发表时间)

共7页

110-116

暂无封面信息
查看本期封面目录

重庆邮电大学学报(自然科学版)

1673-825X

50-1181/N

34

2022,34(1)

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn