基于注意力机制的轻量化图像压缩算法研究
作者单位:重庆理工大学
学位级别:硕士
导师姓名:徐勇;刘瑞华
授予年度:2024年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
摘 要:随着数字图像在各个领域的广泛应用,图像压缩算法的需求逐渐上升,成为当前科技发展的热点之一。深度学习图像压缩作为一种新兴技术,充分利用深度学习网络的强大拟合能力和对复杂图像特征的学习能力,在图像压缩方面取得了显著的压缩性能,为图像传输和存储提供了更为高效的解决方案。现在越来越多的研究人员将目光聚焦于深度学习图像压缩。很多深度学习图像压缩算法已经在某些性能方面超过了传统图像压缩。然而,深度学习图像压缩模型仍然存在未充分考虑捕获图像局部冗余、重建图像质量损失、未能捕捉图像多尺度信息、时间成本高和计算效率低等问题。为了解决这些问题,本文提出了一种基于注意力机制的轻量化图像压缩模型,该模型在图像压缩的编解码时间、客观评价指标以及视觉感官上都取得了一定的进步。本文的主要创新点如下: 1)针对基于CNN模型未充分考虑捕获局部冗余的问题,本文引入了混洗注意力模块,该模块通过对局部特征执行混洗(shuffle)操作,即重新排列或重组局部特征,从而提高网络对非重复纹理和冗余信息的敏感性,使网络在处理复杂场景和细节时更加细致和灵活。将这个模块添加到图像变换网络和图像反变换网络中,以提高网络对局部冗余和非重复纹理的捕获能力,从而提高重建图像质量以及达到更好的压缩效果。 2)针对模型的反变换网络中图像质量损失问题,本文设计了图像质量增强模块,用来增强反变换网络对于图像细节信息的捕获,同时减少重建图像质量的损失。该模块有效地改善了图像细节,提升了图像重建质量以及视觉效果。 3)针对CNN模型未能捕捉多尺度信息、时间成本高和计算效率低等问题,本文提出了组合卷积模块。该模块由多个卷积操作组成,融入了分组卷积和空洞卷积等设计思想。将其替换网络中的部分卷积操作,提高了重建图像质量,同时降低了网络的计算复杂度和参数量。此外,还将网络从单高斯模型扩展到多高斯模型,使得模型能够更好地拟合复杂数据分布和更准确地概率建模,提高了此模型的表达能力和泛化能力。