基于深度学习的图像修复检测算法研究
作者单位:杭州电子科技大学
学位级别:硕士
导师姓名:陈临强;姚晔
授予年度:2023年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:图像修复检测 深度学习 视觉自注意力模型 空洞卷积 门控单元
摘 要:随着图像处理和机器视觉技术的兴起,互联网上涌现了大量操作简单的图像编辑软件,普通民众可以轻易修改、编辑图像并上传社交网络。然而,数字图像修复技术不仅可以用于修补破损图像,还可能被用在抹除特定人物、篡改图像语义等方面。如果修复篡改后的图像在互联网上肆意传播,将会对个人和社会造成严重的不良影响。因此,针对图像的深度修复取证研究对维护网络安全与社会稳定具有重要意义,成为了信息安全领域的前沿热点。目前图像的深度修复检测仍处于起步阶段,许多研究仅针对特定的修复手段设计相应检测算法,对于未知的修复方法存在检测精度差、缺乏泛化能力等问题。针对上述问题,本文提出了两个基于卷积神经网络图像修复检测算法,充分挖掘了图像内部修复区域的潜在特征,增强了模型对未知修复手段的检测性能。本文的具体工作如下:(1)本文提出一种针对数字图像的深度修复检测方法,采用基于卷积神经网络和视觉自注意力模型的编码器-解码器架构,能够在提取低分辨率特征的同时获得修复图像内部的远程依赖关系。特征增强模块使用三种不同的高通滤波器提取噪声残差,有效增强修复痕迹。解码器结合不同维度的残差特征对编码器输出的特征图上采样操作实施监督,指导模型对修复区域的准确定位。(2)为了提高对小面积或不规则形状的修复样本的检测能力,本文提出一种基于多级门控单元的图像修复检测算法。多级门控单元能够促使模型衡量每个编码器输出块的贡献,突出更具鉴别性的修复特征。该算法将编码器分支的输出与多级门控单元进行级联,在最小化干扰信息的同时为解码器分支提供丰富的上下文信息。此外,通过在训练时加入视觉上更难察觉的修复样本,有效提高了本文模型对困难样本的特征学习能力。本文模型在单一修复方法合成的数据集上进行训练,测试时分别在使用传统修复方法以及基于深度学习的修复方法合成的数据集上检测模型的性能,并且与多个现有方法进行比较。本文通过在测试集上开展的基准实验、泛化性实验和鲁棒性测试等实验,证明了所提出的两个修复检测模型在泛化性和鲁棒性上均优于对比方法。