10.14081/j.cnki.hgdxb.2024.04.004
基于Vision Transformer和卷积注入的车辆重识别
针对车辆重识别中提取特征鲁棒性不高的问题,本文提出基于Vision Transformer的车辆重识别方法.首先,利用注意力机制提出目标导向映射模块,并结合辅助信息嵌入模块,抑制由不同视角、相机拍摄及无效背景引入的噪声.其次,以Vision Transformer远距离建模能力为基础提出通道感知模块,通过并行设计模型能够同时获取图像块之间和图像通道之间的特征,在关注图像块之间关联的基础上,进一步构建通道之间的关联.最后,利用卷积神经网络的局部归纳偏置,将全局特征向量输入到卷积注入模块中进行细化,并与全局特征联合优化,以构建鲁棒性的车辆特征.为了验证提出方法的有效性,在Ve-Ri776、VehicleID和VeRi-Wild数据集上分别进行了实验验证.实验结果证明,本文的方法取得了良好的效果.
车辆重识别、Vision Transformer、卷积神经网络、目标导向映射、通道感知
53
TP391.41;U495(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金
2024-09-09(万方平台首次上网日期,不代表论文的发表时间)
共11页
40-50