注意力机制在自然场景文字检测中的应用
针对目前主流的基于分割的文字检测方法中由于需要复杂的后处理过程保证检测精度,通常难以实现高检测速度的问题,提出一种应用位置注意力模块和金字塔注意力网络2种注意力机制的方法.首先用金字塔注意力网络对图像进行特征提取及语义分割;同时将位置注意力模块应用于高层特征,通过加强图像中相似物体的权重加强对文字的检测效果;最后进行简单有效的后处理,在实现较高检测准确度的前提下提高检测速度.实验结果表明,在Total-text数据集中,采用更轻量化的骨干网络时,所提方法在检测速度上优势明显;采用更深层的骨干网络时,所提方法的检测准确度领先2.0%.
自然场景文字检测;神经网络;金字塔注意力网络;位置注意力机制
33
TP391.41(计算技术、计算机技术)
国家自然科学基金面上项目61771145
2022-01-04(万方平台首次上网日期,不代表论文的发表时间)
共8页
1908-1915