基于逆扰动融合生成对抗网络的对抗样本防御方法
Adversarial Example Defense Method Based on Inverse Perturbation Fusing Generative Adversarial Network作者机构:燕山大学信息科学与工程学院河北秦皇岛066004 河北省计算机虚拟技术与系统集成重点实验室河北秦皇岛066004
出 版 物:《电子学报》 (Acta Electronica Sinica)
年 卷 期:2023年第51卷第4期
页 面:879-884页
核心收录:
学科分类:0710[理学-生物学] 08[工学] 081104[工学-模式识别与智能系统] 0804[工学-仪器科学与技术] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:中央引导地方科技发展资金(No.216Z0301G) 国家自然科学基金(No.61379065) 河北省自然科学基金(No.F2019203285)。
主 题:对抗样本 生成对抗网络 逆扰动 对抗扰动消除 防御方法
摘 要:为了有效抵御对抗样本误导深度神经网络模型,提出一种基于逆扰动融合生成对抗网络的对抗样本防御方法(Inverse Perturbation Fusing Generative Adversarial Network,IP-GAN).充分利用对抗样本中的对抗扰动信息,确定以逆扰动作为对抗样本防御方法的研究出发点,并从高维特征空间进行有效性分析.IP-GAN方法借鉴生成对抗网络思想,以生成器架构作为逆扰动构造模型,依据对抗样本构造相应的逆扰动用于获取重构样本,并引入深度神经网络模型指导逆扰动优化方向,最终将重构样本输入至深度神经网络模型获取正确分类结果.实验结果表明,所构造的逆扰动可有效消除对抗扰动,辅助DNN模型正确识别并分类对抗样本,与现有最新防御方法相比,IP-GAN方法在MNIST和ImageNet数据集上防御成功率分别平均提高了0.86%和2.96%.