10.3778/j.issn.1002-8331.1603-0349
基于卷积词袋网络的视觉识别
近年来,卷积神经网络(CNN)凭借其强大的特征学习能力在视觉识别领域取得重要进展。针对CNN全连接层对图像平移、旋转、缩放等变换比较敏感的问题,提出了一种混合模型——卷积词袋网络(BoCW-Net)。它将BoW模型嵌入CNN结构中并代替全连接层,通过端到端的方式学习特征、字典和分类器。为实现BoCW-Net整个网络的有监督学习,提出基于方向相似度的BoCW编码。同时,为充分利用中层特征和高层特征的鉴别性,将中层辅助分类器与高层分类器集成,形成主-辅集成分类器。实验结果表明:相比全连接层,BoCW表示对各种变换具有更强的不变性;主-辅集成分类器能有效融合中层、高层特征,提高BoCW-Net的识别性能;相比新近发展的CNN模型,BoCW-Net在CIFAR-10、CIFAR-100和MNIST数据库上均取得了改进的识别性能,最终分别获得4.88%、22.48%和0.21%的测试错误率。
卷积神经网络、卷积词袋(BoCW)表示、主-辅集成分类器
52
TP183(自动化基础理论)
国家自然科学基金委员会-广东联合基金No.U1301253;广东省科技计划项目No.2014A020208108。
2016-11-18(万方平台首次上网日期,不代表论文的发表时间)
共8页
180-187