基于多尺度Transformer融合多域信息的伪造人脸检测
当前,基于Deepfakes等深度伪造技术生成的"换脸"类伪造视频泛滥,给公民个人隐私和国家政治安全带来巨大威胁,为此,研究视频中深度伪造人脸检测技术具有重要意义.针对已有伪造人脸检测方法存在的面部特征提取不充分、泛化能力弱等不足,提出一种基于多尺度Transformer对多域信息进行融合的伪造人脸检测方法.基于多域特征融合的思路,同时从视频帧的频域与 RGB域进行特征提取,提高模型的泛化性;联合 EfficientNet和多尺度Transformer,设计多层级的特征提取网络以提取更精细的伪造特征.在开源数据集上的测试结果表明,相比已有方法,所提方法具有更好的检测效果;同时在跨数据集上的实验结果证明了所提模型具有较好的泛化性能.
伪造人脸检测、多尺度Transformer、EfficientNet、频域特征、特征融合
50
TP391(计算技术、计算机技术)
2023-10-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
112-118