基于注意力机制的多尺度特征图像分割
作者单位:辽宁石油化工大学
学位级别:硕士
导师姓名:张燕
授予年度:2021年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:深度学习 卷积神经网络 图像分割 通道注意力 位置注意力 城市街道场景
摘 要:卷积神经网络是深度学习领域的一个方向之一,随着近几年计算机领域的高速发展,促进了人工智能在各领域中的应用。随着大数据时代的到来和计算机硬件水平的急速提升,使深度学习可以设计更深的网络结构,并在各种计算机视觉领域取得了突破性的进展。深度学习以人工神经网络作为基础,以大规模数据样本作为驱动力。本文以图像分割问题作为研究对象,针对深度学习中卷积神经网络在图像分割中存在的问题展开了研究。图像分割技术对图像中的每一个像素点根据其语义进行分类,按照其所属标签,对图像中不同类别的像素按其表桥进行标记。得益于卷积神经网络的进步,基于卷积神经网络的图像分割算法也取得了极大地发展,分割精准度相比较传统算法进一步得到了改善,可以满足一些实际复杂场景的实际任务需求,目前图像分割广泛应用于无人驾驶、遥感图像和医疗诊断等多个领域。本文提出了一种新的基于注意力机制的卷积神经网络图像分割模型,通过利用预先训练的Res Net50提取输入图像的特征,在Res Net50模型中多个卷积层中提取特征,并通过注意力机制对特征图不同通道和空间位置重新分配权重,增强对分割任务重要特征,抑制冗余特征,从而使网络更好地学习对分割任务有价值的特征,增强分割精准度。在City Scapes数据集上与目前先进的图像分割模型进行了对比实验,证明了本文模型的有效性。