基于ConvNeXt热图定位和对比学习的细粒度图像分类研究
针对细粒度图像分类中高类内差异和低类间差异的挑战,提出一种以 ConvNeXt网络为主干,使用 GradCAM热图进行裁剪和注意力擦除的多分支细粒度图像分类方法.该方法利用 GradCAM通过梯度回流得到网络的注意力热图,定位到具有判别性特征的区域,裁剪并放大该区域,使网络关注局部更深层次的特征.同时引入有监督的对比学习,扩大类间差异,减小类内差异.最后进行热图注意力擦除操作,使网络在关注最具判别性特征的前提下,也能关注其他对分类有用的区域.所提方法在CUB-200-2011,Stanford Cars,FGVC Aircraft 和 Stanford Dogs 数据集上的分类准确率分别达到了 91.8%,94.9%,94.0%,94.4%,优于多种主流的细粒度图像分类方法,并且在 CUB-200-2011 和 Stanford Dogs 数据集上分别达到了 top-3 和top-1 的分类准确率.
细粒度图像分类、注意力、有监督对比学习、热图、多分支
50
TP391(计算技术、计算机技术)
2023-10-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
119-125