10.3778/j.issn.1002-8331.2101-0301
基于腐蚀批归一化层的对抗攻击算法
目前在对抗样本生成研究领域,基于梯度的攻击方法由于生成速度快和资源消耗低而得到广泛应用.然而,现有大多数基于梯度的攻击方法所得对抗样本的黑盒攻击成功率并不高.最强基于梯度的攻击方法在攻击6个先进防御黑盒模型时的平均成功率只有78.2%.为此,提出一种基于腐蚀深度神经网络架构中批归一化层的对抗攻击算法来改进现有基于梯度的攻击方法,以实现所得对抗样本的黑盒攻击成功率进一步提升.在一个ImageNet兼容数据集上做了大量实验,实验结果表明所提出的算法在单模型攻击和集成模型攻击中均能与现有基于梯度的攻击方法有效组合,实现在几乎不增加额外计算开销条件下增强对抗样本的攻击性能.此外,所提算法还使得最强基于梯度的攻击方法针对6个先进防御黑盒模型的平均攻击成功率提升了9.0个百分点.
对抗样本;黑盒攻击;腐蚀;批归一化层
57
TP181(自动化基础理论)
国家自然科学基金62076251
2021-08-25(万方平台首次上网日期,不代表论文的发表时间)
共9页
116-124