基于DeepLab的街景图像语义分割研究
作者单位:辽宁工程技术大学
学位级别:硕士
导师姓名:刘万军
授予年度:2022年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
主 题:语义分割 场景解析 深度可分离卷积 上下文相关性 多尺度金字塔
摘 要:语义分割作为计算机视觉中一项场景解析推理任务,通过将图像逐像素分类标记为不同类别,从而解决现实场景理解难题。在复杂街景图像分割应用中,聚合多尺度目标上下文相关性,关联语义类别,有利于提高语义分割的推理准确性。本文致力于解决街景图像中语义分割目标比例变化多样性和预测结果不准确的问题,基于Deep Lab网络模型系列,提出了一种语义分割网络模型算法。针对编解码语义分割网络模型中深度卷积神经网络计算复杂度问题,使用深度可分离卷积优化编码器结构,对特征图空间和通道维度解耦映射,以空洞卷积计算提升下采样特征图感受野,保留空间分辨率结构。针对街景场景图像目标比例变化多样性问题,提出迭代空洞卷积金字塔模块对多尺度信息建模,以级联特征图映射扩展感受野范围,反馈连接不同层次金字塔层特征,聚合不同感受野的相关语义类别上下文信息,融合多尺度重采样结果。另外,对语义分割中解码器结构使用双线插值方法缺失细节信息的问题,提出对多尺度特征图进行通道扩展的上采样算法,恢复更多可靠预测结果细节,提高语义分割的效果和精度。使用平均交并比(MIo U)和平均像素精度(MPA)分别在Cityscapes、Cam Vid和ADE20K三个数据集上定量分析验证提出的方法,其中MIo U结果为82.9%、84.6%和46.7%,MPA为89.0%、90.9%和54.5%。该论文有图39幅,表11个,参考文献65篇。