基于图像三元组挖掘的无监督视觉表示学习
特征表示是计算机视觉应用中的关键问题之一,由于视觉数据的海量增长和人工标记的高成本问题,无监督视觉表示学习逐渐受到了人们的广泛关注.该文提出一种基于图像三元组挖掘的无监督视觉表示学习方法.该方法包含两个部分:挖掘图像三元组和学习特征表示.具体而言,首先构建二分类卷积神经网络,从图像数据集中挖掘三元组,即图像、与其相似的图像、与其不相似的图像这三者构成的数据.然后使用得到的图像三元组作为监督信息,通过训练Triplet卷积神经网络来获得视觉表示.为了验证该文所提出的学习方法,该文将学习得到的特征表示应用到常用图像数据集的聚类和分类问题上.在聚类方面,相较于传统的视觉特征方法,该文特征的聚类表现在规范化互信息上有12.7%的提升;在分类方面,所提出的方法也取得了有竞争力的结果,实验表明该文所提出的方法是有效的.
无监督学习、视觉表示学习、图像三元组、卷积神经网络、深度学习
41
TP183(自动化基础理论)
国家自然科学基金60973059,81171407;教育部新世纪优秀人才支持计划NCET-10-0044
2019-03-18(万方平台首次上网日期,不代表论文的发表时间)
共17页
2787-2803