咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >场景解析中基于注意力机制的实时语义分割算法研究 收藏
场景解析中基于注意力机制的实时语义分割算法研究

场景解析中基于注意力机制的实时语义分割算法研究

作     者:龚宇 

作者单位:重庆邮电大学 

学位级别:硕士

导师姓名:胡学刚

授予年度:2022年

学科分类:08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0811[工学-控制科学与工程] 

主      题:卷积神经网络 语义分割 注意力机制 编解码结构 

摘      要:基于深度学习的图像语义分割算法在场景解析任务中起着至关重要的作用。该算法主要分为两个阶段,在编码阶段,其借助骨干网将图像的分辨率降低,从而加快模型的推理速度。在解码阶段,模型将每个像素分配指定的类别。针对场景解析任务中,高精度的语义分割算法参数量较大或分割速度较慢的问题,本文提出了两种实时语义分割模型:1.提出基于轻量级非对称膨胀网络的实时语义分割方法,其参数量仅为0.94M。首先,编码阶段设计了两个不同的轻量级非对称膨胀模块。这两个模块利用不同尺寸的卷积核去捕获特征信息,然后再进行特征融合,以扩大单个模块的感受野,从而使模型拥有更好识别目标特征的能力。同时,通过使用深度级卷积替换普通卷积的方法,设计了一个轻量级下采样模块,并添加特征增强模块以增强模型的感兴趣区域,在保证分割精度不变的同时降低参数量。其次,解码阶段设计了一个注意力增强解码器,其只需要很少的计算成本就可以提升分割准确度。在Cityscapes上的实验结果表明,本方法在分辨率为512×1024的图像上,处理速度为每秒79.5帧,分割精度达到了71.1%。该方法拥有较高分割精度,同时能够更快处理图像速度。2.提出基于双路径特征融合网络的实时语义分割方法。该网络在编码器阶段构造了不同的特征提取模块,并融合不同路的特征信息提高模型的分割精度。该算法通过在解码器部分使用融合中间特征信息的方式,来保证模型不会因为过多的卷积操作而损害特征信息,这样既节约了内存占用,又保证了模型的分割精度。在Cityscapes上的实验结果表明,所提出的方法的分割精度可以达到67.7%,相较于同类语义分割模型具有较高的优势。本方法在分辨率为512×1024的图像上,处理速度为每秒111帧,远远超过了实时语义分割的最低标准。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分