MGTL-SAE精细特征学习的图像资源快速检索
[目的/意义]数字图书馆图像资源检索服务需要准确和快速的响应.针对现有深度学习图像检索方法存在特征不够精细和检索速度慢等问题,提出了多组双层稀疏自动编码器(Multi-Group-Two-Layer Sparse Auto-Encoder,MGTL-SAE)精细特征图像资源快速检索方法.[方澍过程]首先,GoogLeNet预处理模型提取图像资源深度学习特征作为初始特征,并用密度峰值聚类算法划分初始特征集.其次,依据聚类类别数构建MGTL-SAE网络结构,聚类划分图像子集中随机抽取图像块初始化MGTL-SAE的均值和方差参数,梯度下降法估计MGTL-SAE网络参数以学习特征直到目标函数收敛,迭代密度峰值聚类和MGTL-SAE参数估计以计算精细特征直到特征基收敛.最后,在图像资源精细特征密度峰值聚类划分子集上快速检索查询样本图像.[结果/结论]实验结果表明,MGTL-SAE方法相较于CaffeNet和GoogLeNet等深度学习检索方法具有更高查准率、查全率和平均mAP,更快检索速度,为数字图书馆图像资源检索研究提供了新视角.
基于内容的图像检索、稀疏自动编码、深度卷积神经网络、目标函数、精细特征学习
41
本文系国家自然科学基金项目“基于多目标优化和栈式稀疏编码的肝脏肿瘤图像识剐研究”;教育部人文社会科学研究青年基金项目“学术信息网络中的核心边缘结构测度研究”;国家级大学生实践创新训练计划项目“基于fasttext深度学习的专利文本快速分类研究”
2020-12-03(万方平台首次上网日期,不代表论文的发表时间)
共9页
79-87