10.3778/j.issn.1002-8331.1910-0008
联合边界框校准的自然场景文本检测
针对自然场景下多方向文本对象,提出一种基于深度学习的文本检测方法.该方法在设计锚框时剥离锚框的方向特征但保留其长宽比特征,在覆盖相同长宽比范围时,锚框设计数量减少,从而缓解采样密集时正负样本类别失衡的影响.在方法的后处理阶段,提出一种边界框校准算法,该算法利用最大稳定极值区域(MSER)获取字符边缘信息,通过基于规则的逻辑判断,对边界框进行收缩或膨胀操作,从而达到边界框校准目的.通过在公开数据集ICDAR2015上的测试与比较,验证了所提边界框校准算法的有效性.
文本检测、自然场景、类别失衡、边界框校准
57
TP391(计算技术、计算机技术)
国家自然科学基金面上项目61271334,61073115
2021-01-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
161-167