基于深度网络的可学习感受野算法在图像分类中的应用
作为图像检索,图像组织和机器人视觉的基本任务,图像分类在计算机视觉和机器学习中受到了广泛的关注.用于目标识别及图像分类的多种基于深度学习的模型同样引发了该领域内的极大兴趣.本文提出了一种取代尺度不变特征变换(SIFT)和方向梯度直方图(HOG)描述子的算法,即利用深度分层结构,按层级学习有效的图像表示,直接从原始像素点学习特征.该方法分别利用K-奇异值分解(K-SVD)和正交匹配追踪(OMP)进行字典训练和编码.此外,本文采用了同时学习分类器和用于池化的感受野方案.实验结果证明,上述算法在目标(Oxford flowers)和事件(UIUC-sports)图像分类测试集中取得了更好的分类性能.
图像分类、分层结构、深度网络、感受野
32
TP391.4(计算技术、计算机技术)
高等学校博士学科点专项科研基金项目20120032110034资助.Supported by Specialized Research Fund for the Doctoral Program of Higher Education 20120032110034
2015-10-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
1114-1119