面向细粒度图像分类的双线性残差注意力网络
细粒度图像之间具有高度相似的外观,其差异往往体现在局部区域,提取具有判别性的局部特征成为影响细粒度分类性能的关键.引入注意力机制的方法是解决上述问题的常见策略,为此,在双线性卷积神经网络模型的基础上,提出一种改进的双线性残差注意力网络:将原模型的特征函数替换为特征提取能力更强的深度残差网络,并在残差单元之间分别添加通道注意力和空间注意力模块,以获取不同维度、更为丰富的注意力特征.在3个细粒度图像数据集CUB-200-2011、Stanford Dogs和Stanford Cars上进行消融和对比实验,改进后模型的分类准确率分别达到87.2%、89.2%和92.5%.实验结果表明,相较原模型及其他多个主流细粒度分类算法,本文方法能取得更好的分类结果.
图像处理、细粒度图像分类、注意力机制、残差网络、通道注意力、空间注意力
57
TP391.4(计算技术、计算机技术)
国家自然科学基金;创新项目
2020-07-24(万方平台首次上网日期,不代表论文的发表时间)
共10页
163-172