基于自注意力的自监督深度聚类算法
近年来,基于联合训练的深度聚类方法,如DEC(Deep Embedding Clustering)和DDC(Deep Denoising Clustering)算法,使基于特征提取的图像聚类取得了很多新进展,带来了聚类性能的突破,而且特征提取环节对后续聚类任务有直接影响.但是,这些方法的泛化能力较差,在不同数据集使用不同的网络结构,聚类性能相比分类性能仍有很大的提升空间.为此,文中提出了一种基于自注意力的自监督深度聚类方法(Self-attention Based Self-supervised Deep Clustering,SADC).首先设计一个深度卷积自编码器用于提取特征,并且用带噪声的输入数据训练该网络来增强模型的鲁棒性;其次引入自注意力机制,辅助网络捕获对聚类有用的信息;最后编码器部分结合K-means算法形成一个深度聚类器,用于进行特征表示和聚类分配,通过迭代更新网络参数来提高聚类精度和网络的泛化能力.在6个图像数据集上验证所提聚类算法的性能,并与深度聚类算法DEC,DDC等进行比较.实验结果表明,SADC能提供令人满意的聚类结果,而且聚类性能与DEC和DDC相当.总之,统一的网络结构在保证聚类精度的同时降低了深度聚类算法的复杂度.
深度卷积自编码器;图像聚类;特征表示;自注意力;计算复杂度
49
TP181(自动化基础理论)
河北省引进留学人员资助项目;河北省自然科学基金;广东省自然科学基金;河北省社会科学基金
2022-03-22(万方平台首次上网日期,不代表论文的发表时间)
共10页
134-143