基于增强特征金字塔网络的场景文本检测算法
场景文本检测有助于机器理解图像内容,在智能交通、场景理解和智能导航等领域应用广泛.现有的场景文本检测算法未充分利用高层语义信息和空间信息,限制了模型对复杂背景像素的分类能力和对不同尺度的文本实例的检测和定位能力.为解决上述问题,提出了一种基于增强特征金字塔网络的场景文本检测算法.该算法包括比率不变特征增强(Ratio Invariant Feature Enhanced,RIFE)模块和重建空间分辨率(Rebuild Spatial Resolution,RSR)模块.RIFE模块作为残差分支,增强了网络的高层语义信息传递,提高了分类能力,降低了误报率和漏捡率.RSR模块重建多层特征分辨率,利用丰富的空间信息改进边界位置.实验结果表明,所提算法提升了在多方向文本数据集ICDAR2015、弯曲文本数据集Totaltext以及长文本数据集MSRA-TD500上的检测能力.
场景文本检测;特征金字塔网络;语义信息;空间信息;边界位置
49
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;国家自然科学基金;江苏省高校自然科学基金重点项目;吉林大学符号计算与知识工程教育部重点实验室项目;江苏高校优势学科建设工程资助项目
2022-03-07(万方平台首次上网日期,不代表论文的发表时间)
共8页
248-255