基于深度学习的高光谱图像分类研究
作者单位:贵州大学
学位级别:硕士
导师姓名:汪泓;支仁泽
授予年度:2023年
学科分类:12[管理学] 081802[工学-地球探测与信息技术] 08[工学] 0810[工学-信息与通信工程] 083002[工学-环境工程] 0830[工学-环境科学与工程(可授工学、理学、农学学位)] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 0818[工学-地质资源与地质工程] 081602[工学-摄影测量与遥感] 0816[工学-测绘科学与技术] 0835[工学-软件工程] 081002[工学-信号与信息处理] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:高光谱遥感 图像分类 卷积神经网络 注意力机制 视觉自注意力模型
摘 要:高光谱遥感技术通过将地物光谱曲线与地面空间影像相结合,实现对地物的准确识别和属性分析。光谱成像仪获取到的高光谱图像不仅包含反映地物物理特性的丰富光谱信息,而且还提供反映地物空间分布和纹理特征的丰富空间信息。基于这些优势,高光谱遥感在精准农业、作物监测、土地资源利用、城市规划等领域得到广泛应用。在环境保护方面,高光谱图像已被用于检测大气、漏油、水质和植被覆盖率变化。然而,高光谱遥感的光谱特征难以准确提取,且标签样本难以标记,因此,通过有效的特征提取方法和小样本计算以提高分类精度是目前高光谱图像分类任务的主攻点之一。近年来,深度学习方法在图像的特征提取上表现卓越,可以有效解决非线性问题,并广泛应用于许多图像处理任务中。基于深度学习在计算机视觉领域的优秀表现,其被引入高光谱图像分类领域并取得了巨大进展。本文基于三维卷积神经网络和Transformer模型,研究了如何有效地提取并融合空间和光谱特征信息、提高神经网络模型对高光谱图像的分类精度,主要研究内容如下:(1)将注意力机制引入卷积神经网络(CNN),提出了基于卷积注意力模块(CBAM)的多尺度特征三维卷积神经网络——MSCBAMNet。该网络先将三维图像块两次卷积成不同尺寸特征,再将卷积后特征依次通过CBAM模块,以此增强重要通道信息的权重,充分利用光谱信息和空间信息,然后将降维得到的二维特征进行融合,最终使网络获取到多层次的有效空谱特征,提高了分类精度。(2)由于卷积神经网络其注意力机制基于局部感受野,难以获取长序列的上下文信息交互,故提出了一种基于多尺度特征和移动窗口光谱自注意力机制的改进Swin Transformer模型MASwin Net,以解决高光谱图像分类任务中全局和局部信息获取的问题。在该模型中使用空间特征提取模块来获取空间信息,使用多尺度光谱融合残差模块和光谱Swin Transformer模块对光谱特征进行建模,最后使用全连接层输出分类结果,在小样本条件下有效增强了分类效果。本文在三个代表性的数据集Indian Pines,University of Pavia和Salinas上进行了实验,并利用总体分类精度、平均分类精度和Kappa系数定量评价分类结果。MSCBAMNet模型在三个数据集上的总体分类精度分别达到98.35%、98.97%、99.14%。MASwin Net模型在三个数据集上的总体分类精度分别达到98.92%、99.59%、99.50%。实验结果表明,本文改进后的两个模型在高光谱图像分类任务上取得了更高的精度,且MASwin Net由于结合了CNN和Transformer的优点,比MSCBAMNet分类效果更胜一筹,实验结果也显示所提出的两个模型对于小样本分类的适用性更强,证明了本文方法的有效性。