10.16157/j.issn.0258-7998.200316
基于分割的自然场景下文本检测方法与应用
自然场景文本检测识别在智能设备中应用广泛,而对文本识别的第一步则是对文本进行精确的定位检测.对于现有像素分割方法PixelLink中存在的弯曲文本定位包含过多背景信息、检测图像后处理不足两个主要问题提出改进.引入特征通道注意力机制,关注生成特征图中特征通道间的权重关系,提升检测方法的鲁棒性.接着改变公开数据集标注形式,将坐标点表示为一串带有方向的序列形式,在LSTM模型中进行多边形框的学习与框定.最后在公开数据集和自建数据集上进行文本检测测试.实验表明,改进的检测方法在各数据集中表现优于原方法,与当前领先方法精度相近,能够在各个环境中完成对文本的检测功能.
像素分割、注意力机制、LSTM、自然场景文本检测
47
TN911.73;TP391.4
国家自然科学基金;江苏省自然科学基金;江苏大学高级专业人才科研启动基金
2021-03-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
54-57