深度区域网络方法的细粒度图像分类
目的 在细粒度视觉识别中,难点是对处于相同层级的大类,区分其具有微小差异的子类,为实现准确的分类精度,通常要求具有专业知识,所以细粒度图像分类为计算机视觉的研究提出更高的要求.为了方便普通人在不具备专业知识和专业技能的情况下能够区分物种细粒度类别,进而提出一种基于深度区域网络的卷积神经网络结构.方法 该结构基于深度区域网络,首先,进行深度特征提取任务,使用VGG16层网络和残差101层网络两种结构作为特征提取网络,用于提取深层共享特征,产生特征映射.其次,使用区域建议网络结构,在特征映射上进行卷积,产生目标区域;同时使用兴趣区域(RoI)池化层对特征映射进行最大值池化,实现网络共享.之后将池化后的目标区域输入到区域卷积网络中进行细粒度类别预测和目标边界回归,最终输出网络预测类别及回归边框点坐标.同时还进行了局部遮挡实验,检测局部遮挡部位对于分类正确性的影响,分析局部信息对于鸟类分类的影响情况.结果 该模型针对CUB_200_ 2011鸟类数据库进行实验,该数据库包含200种细粒度鸟类类别,11 788幅鸟类图片.经过训练及测试,实现VGG16+R-CNN(RPN)和Res101+ R-CNN(RPN)两种结构验证正确率分别为90.88%和91.72%,两种结构Top-5验证正确率都超过98%.本文模拟现实环境遮挡情况进行鸟类局部特征遮挡实验,检测分类效果.结论 基于深度区域网络的卷积神经网络模型,提高了细粒度鸟类图像的分类性能,在细粒度鸟类图像的分类上,具有分类精度高、泛化能力好和鲁棒性强的优势,实验发现头部信息对于细粒度鸟类分类识别非常重要.
细粒度、深度区域网络、卷积神经网络、鸟类分类、残差网络
22
TP391(计算技术、计算机技术)
国家自然科学基金项目31200544;National Natural Science Foundation of China31200544
2017-12-11(万方平台首次上网日期,不代表论文的发表时间)
共11页
1521-1531