基于图像去噪和图像生成的对抗样本检测方法
Adversarial Example Detection Method Based on Image Denoising and Image Generation作者机构:中国民航大学安全科学与工程学院天津300300 中国民航大学计算机科学与技术学院天津300300
出 版 物:《湖南大学学报(自然科学版)》 (Journal of Hunan University:Natural Sciences)
年 卷 期:2023年第50卷第8期
页 面:72-81页
核心收录:
学科分类:08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金民航联合研究基金项目(U1833107)。
主 题:对抗攻击 对抗样本 vision-transformer swin-transformer 卷积神经网络 深度学习
摘 要:针对现有对抗样本检测方法存在检测准确率低和训练收敛速度慢等问题,提出一种基于图像去噪技术和图像生成技术实现的对抗样本检测方法 .该检测方法将对抗样本检测问题转换为图像分类问题,无须事先得知被攻击模型的结构和参数,仅使用图像的语义信息和分类标签信息即可判定图像是否为对抗样本.首先,采用基于swin-transformer和vision-transformer实现的移动窗口式掩码自编码器去除图像中的对抗性噪声,还原图像的语义信息.然后,使用基于带有梯度惩罚的条件生成式对抗网络实现的图像生成部分根据图像分类标签信息生成图像.最后,将前两阶段输出的图像输入卷积神经网络进行分类,通过对比完成去噪的图像和生成图像的分类结果一致性判定检测图像是否为对抗样本.在MNIST、GTSRB和CIAFAR-10数据集上的实验结果表明,相比于传统检测方法,本文提出的对抗样本检测方法的平均检测准确率提高6%~36%,F1分数提高6%~37%,训练收敛耗时缩减27%~83%,存在一定优势.