结合地物特性与注意力机制的多光谱影像人参地块语义分割算法研究
作者单位:新疆农业大学
学位级别:硕士
导师姓名:古丽米拉·克孜尔别克;李莹
授予年度:2023年
学科分类:1008[医学-中药学(可授医学、理学学位)] 0810[工学-信息与通信工程] 08[工学] 081002[工学-信号与信息处理] 10[医学]
主 题:注意力机制 传统语义分割 深度学习语义分割 NDVI U-Net
摘 要:人参是一种稀有且药用价值高的草本植物,国内市场需求量大,我国采用农田栽培和林下种植的方式向市场提供人参资源。然而随着人参种植情况的不断扩增,大肆砍伐森林及超范围占用耕地资源种植人参,导致耕地土地养分流失,林地的森林覆盖率下降。因此,高效监测人参种植的空间分布情况,对监测我国林地和耕地资源的合理利用具有重要意义。传统的人参种植监测方法主要基于人工目测和地面勘测,其存在成本高、效率低的问题。基于深度学习语义分割的遥感图像处理方法有效弥补了传统监测方法的不足,并凭借其准确地识别遥感图像目标的优势为高效监测人参地块提供了技术支持。但现有基于深度学习的语义分割方法在处理遥感图像时,大多从模型的改进入手,尽管得到了较佳的分割效果,但忽略了遥感图像本身所具有的特性。本文为了利用遥感图像所具有地物特性NDVI辅助语义分割网络处理遥感图像,在输入图像中引入了植被归一化指数NDVI(Normalized Difference Vegetation Index)作为第五通道数据辅助分割网络分割目标对象,同时通过在U-Net语义分割网络中结合注意力机制的方式提高模型的分割效果。本文以2020年黑龙江省哨兵2号遥感图像作为数据源,人参地块为研究对象,通过ENVI与Arc GIS对影像数据进行预处理操作获取样本数据集,将所得样本数据集按照8:1:1的比例划分为训练集、测试集和验证集。利用编程环境计算每张输入的遥感图像中目标区域的NDVI值与背景的NDVI值,并将计算所得NDVI值作为输入图像的第五通道数据堆叠至输入图像的通道维中,同时在深度学习语义分割网络中结合注意力机制来关注输入图像有意义或有价值的特征信息,最终实现了有效弥补特征信息丢失及提高分割效果的问题。具体研究如下:(1)针对遥感图像在深度学习语义分割网络中丢失特征信息及目标分割准确率较低的问题,提出了在经典遥感图像语义分割网络U-Net中加入注意力机制的改进方法,该方法通过在U-Net网络的四个底层特征图与高层特征图的跳跃连接部分分别引入注意力机制中的空间注意力模块和通道注意力模块关注目标对象中具有价值的特征信息,如纹理、几何等特征。实验结果表明结合注意力机制后U-Net网络的分割效果得到有效提升。为了对比改进后的U-Net网络与其他经典的深度学习语义分割模型在引入注意力机制后的分割效果,在自制的哨兵2号遥感图像样本数据集上进行实验,结果证实了无论是改进后的U-Net网络还是引入注意力机制的其他经典深度学习语义分割模型,均在识别遥感图像人参地块上得到有效提升,其中改进的U-Net网络是经典语义分割网络中对人参地块识别效果最佳的网络模型。(2)针对忽略遥感图像中目标对象本身所具有的特性信息的问题。提出了引入遥感图像特性信息NDVI作为输入图像的第五通道数据辅助语义分割网络提升网络分割效果的方法。此方法通过在编程环境中采用哨兵2号多光谱遥感图像中红波段和近红外波段计算每个输入图像中所有像元的NDVI值,并将计算所得NDVI值作为输入图像数据的第五通道进行堆叠,最终将叠加了NDVI的输入图像送入U-Net网络进行处理。实验结果表明,该网络在引入影像特性NDVI后在训练集上的分割结果达到了85.87%,最终网络的分割效果不仅得到了提高,而且通过比对除U-Net网络外其他经典语义分割网络在引入影像特性NDVI后对遥感图像人参地块上的识别效果得知,引入NDVI后的输入图像在送入不同经典语义分割网络均得到不同程度的提高,但U-Net网络的分割效果与其他经典的语义分割网络的分割效果相比,U-Net网络依然高出其他经典语义分割网络。(3)通过结合(1)和(2)两种改进方式,提出了同时结合地物特性NDVI与注意力机制的遥感图像语义分割方法。该方法不仅将通过编程环境计算的每张样本数据的NDVI值作为第五通道堆叠至输入图像,而且将堆叠了NDVI后的输入图像数据送入结合了注意力机制的经典深度学习语义分割网络中进行处理。实验结果表明,同时结合地物特性NDVI与注意力机制的网络相比于单独结合注意力机制或引入地物特性NDVI的网络,结合两种方式的分割效果均高于单方面改进网络或者单方面优化输入数据的分割效果。根据同时结合地物特性NDVI与注意力机制的U-Net网络的分割结果与其他经典语义分割网络相比得知,改进后的U-Net网络的分割结果虽然平均交并比、分割准确率等提升效果较低与其他经典网络,但改进后的U-Net网络整体上分割准确率和效率均高于其他语义分割网络。此结果也进一步说明了处理分割遥感图像目标时,从结合影像中地物特性信息和改进模型两方面入手对提升网络模型分割效果具有重要意义。