基于卷积神经网络的图像超分辨率重建方法研究
作者单位:北京交通大学
学位级别:硕士
导师姓名:申艳
授予年度:2020年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:图像超分辨率 卷积神经网络 生成对抗网络 深度学习 注意力机制
摘 要:图像的空间分辨率是衡量图像质量的一项重要指标。在图像成像过程中,由于受到成像设备的物理限制以及外界环境等多种因素的影响,无法获得满足实际需求的高分辨率图像。图像超分辨率(Super-Resolution,SR)重建技术可以通过图像处理的方式,克服成像系统硬件的固有局限性,实现低分辨率图像到高分辨率图像的重建目标。得益于卷积神经网络(Convolutional Neural Network,CNN)在高级计算机视觉任务中的广泛应用,目前以CNN为基础的超分辨算法已经成为图像超分辨领域的主流算法。本文根据算法所采用上采样方式及其在网络结构中所处位置不同,对目前基于CNN的超分辨算法进行系统性的整理和分类,并分别从算法的网络结构设计策略和复杂退化场景的图像重建任务两个方面展开工作,具体包括:(1)在算法的网络结构设计策略方面,由于目前超分辨算法对于重建性能的提升过于依赖网络层数的加深或特征数量的增加,反而整体降低了网络对图像特征信息的利用率,无法显著提升图像重建质量。本文提出一种基于深度多级上投影网络(Deep Multi-level Up-projection Network,DMUN)的图像超分辨率重建算法。DMUN通过局部特征上投影单元在网络局部实现图像多级低分辨率特征信息的融合以提高整体网络对图像特征的利用率,其中残差上投影组整体采用递归方式的网络结构用于控制模型的参数成本,残差激活块将传统的残差结构与空间通道注意力机制相结合,改善网络模型的特征表达能力,避免网络对冗余特征的重复利用。实验表明,DMUN在算法重建性能和模型参数量之间取得了更好的平衡。(2)在复杂退化场景的图像重建任务方面,针对目前基于CNN的超分辨算法大多只针对单一退化场景的图像重建任务所面临的局限性,本文开展对于噪声图像超分辨率重建任务的研究,并提出一种基于条件生成对抗网络的噪声图像超分辨率重建算法NSRGAN(Noisy-image Super-Resolution using conditional Generative Adversarial Network)。为了更好地处理低分辨率图像中的噪声信息,NSRGAN在DMUN的基础上引入一个新的噪声强度估计网络为噪声图像的超分辨重建过程提供辅助条件约束。此外,本文考虑了基于相机成像过程和基于生成对抗网络的两种真实噪声模型来建模更加真实复杂的图像退化场景。通过多种噪声模型下的实验分析表明,与现有超分辨算法相比,NSRGAN在噪声图像超分辨重建这一较为复杂的任务上展现出了更好的鲁棒性。