10.13733/j.jcam.issn.2095-5553.2023.01.028
细粒度图像识别任务的多层和区域特征融合模型
细粒度图像识别任务中,在整体相似度极大而局部细节不同的图片中提取具有关注度的区域,并对其中的特征加以学习是至关重要的任务.针对目前研究中存在的人工标注判别区域的成本太高、模型构建中需引入大量额外的网络结构,在训练和推理阶段会引入额外的计算开销等问题,研究优化后提出多层和区域特征融合模型.模型基于注意力机制进行构建,模拟人类观察原理,提升对有价值的局部细节的关注能力,提高在经典数据集上的识别效果.本模型主要分为带有注意力权重的卷积神经网络多层融合和基于区域特征之间依赖性的区域融合两个部分.整体主要以注意力机制为主,注重特征提取时全面考虑图像细节特征和抽象特征以及对于不同区域的组成与各个区域之间的依赖关系,在兼顾整体的情况下同时发挥局部细节的影响力.试验结果表明:在部分经典数据集上具有良好的准确率,Oxford Flowers数据集准确率为95.69%,同时在AID(航拍图像)数据集上具有96.96%的准确率,此前没有任何模型在该数据集上有过相关研究和模型训练.
细粒度图像识别、注意力机制、卷积神经网络、特征提取、特征融合
44
TP391.41(计算技术、计算机技术)
南京航空航天大学校级大学生创新创业训练计划项目2021CX016013
2023-03-10(万方平台首次上网日期,不代表论文的发表时间)
共9页
199-207