基于BN优化SNGAN的自适应音频隐写
音频隐写术是将秘密信息(如文本、图像、音频、视频等)隐藏到载体音频中,不仅能够保证秘密信息本身的安全,而且能保证秘密信息传输的安全,已成为信息隐藏领域的研究热点之一.近年来,基于深度学习的音频隐写分析技术能够在充分挖掘隐写深度特征的基础上实现高效的隐写检测,导致隐写术的安全性降低,为隐写术带来了新的挑战.不过,生成对抗网络(Generative Adversarial Networks,GAN)的迅速发展,为音频隐写提供了一个新的解决思路.但是,现有基于GAN的音频隐写在隐藏容量、不可感知性、抗检测性上很难达到均衡,不能满足实际应用需求.为此,本文在网络结构单元上将批处理归一化与频谱归一化相结合,提出了一种基于优化频谱归一化GAN的自适应音频隐写方法(Batch Normalization optimized Spectral Normalization GAN,BNSNGAN).具体来说,首先设计了一种隐写编码器,基于时域补零法对秘密音频进行预处理,实现了任意长度秘密音频的嵌入,提高了音频隐写的不可感知性;其次设计了一种具有并行结构的隐写提取器,用不同的卷积核进行去卷积,提高了秘密信息提取的准确率;最后设计了一种以交叉熵为损失函数的隐写分析器,提高了音频隐写的抗检测性.对比实验结果表明,通过编码器、提取器和隐写分析器这三个网络的互相学习,本文所提BNSNGAN不仅可以实现任意长度秘密音频的嵌入,具有较高的秘密信息提取率,并且在隐写容量、不可感知性和抗检测性上可以达到一个较好的均衡.
音频隐写;生成对抗网络;频谱归一化;批处理归一化;自适应隐写
45
TP391(计算技术、计算机技术)
教育部人文社会科学研究项目;广东省类脑智能计算重点实验室开放课题;中央高校基本科研业务费专项资金项目;中央高校基本科研业务费专项资金项目;中央高校基本科研业务费专项资金项目
2022-03-22(万方平台首次上网日期,不代表论文的发表时间)
共14页
427-440