一种基于正交约束的隐空间多语义学习方法
探索生成对抗网络隐空间的语义信息是当前生成对抗网络图像可控生成方向的研究热点.目前的研究在探索隐空间的语义时往往每次只学习某一个属性对应的语义方向,而这种方式没有考虑不同语义方向之间可能发生纠缠的问题,因此在控制生成图像某一属性变化时会影响到其他属性.为了解决此类问题,提出了一种基于正交约束的多语义学习方法,该方法在同时学习多个语义方向的训练过程中加入正交约束以减少不同语义方向之间的关联性,从而避免了不同语义方向间的纠缠问题.基于大规模生成对抗网络(BigGAN)模型在ImageNet数据集进行了水平平移、垂直平移和亮度等多语义方向的同步学习实验.实验结果表明,提出的方法能有效同时学习隐空间的多个语义方向,实现图像多个属性可控生成,同时能有效地保持不同语义方向之间的独立性.
图像生成、生成对抗网络、隐空间、可控生成
18
TP391(计算技术、计算机技术)
2022-04-18(万方平台首次上网日期,不代表论文的发表时间)
共4页
42-45