场景解析中基于注意力机制的实时语义分割算法研究-南通市图书馆

文献详情 >场景解析中基于注意力机制的实时语义分割算法研究收藏

场景解析中基于注意力机制的实时语义分割算法研究

作者：龚宇

作者单位：重庆邮电大学

学位级别：硕士

导师姓名：胡学刚

授予年度：2022年

学科分类：08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0811[工学-控制科学与工程]

主题：卷积神经网络语义分割注意力机制编解码结构

摘要：基于深度学习的图像语义分割算法在场景解析任务中起着至关重要的作用。该算法主要分为两个阶段,在编码阶段,其借助骨干网将图像的分辨率降低,从而加快模型的推理速度。在解码阶段,模型将每个像素分配指定的类别。针对场景解析任务中,高精度的语义分割算法参数量较大或分割速度较慢的问题,本文提出了两种实时语义分割模型:1.提出基于轻量级非对称膨胀网络的实时语义分割方法,其参数量仅为0.94M。首先,编码阶段设计了两个不同的轻量级非对称膨胀模块。这两个模块利用不同尺寸的卷积核去捕获特征信息,然后再进行特征融合,以扩大单个模块的感受野,从而使模型拥有更好识别目标特征的能力。同时,通过使用深度级卷积替换普通卷积的方法,设计了一个轻量级下采样模块,并添加特征增强模块以增强模型的感兴趣区域,在保证分割精度不变的同时降低参数量。其次,解码阶段设计了一个注意力增强解码器,其只需要很少的计算成本就可以提升分割准确度。在Cityscapes上的实验结果表明,本方法在分辨率为512×1024的图像上,处理速度为每秒79.5帧,分割精度达到了71.1%。该方法拥有较高分割精度,同时能够更快处理图像速度。2.提出基于双路径特征融合网络的实时语义分割方法。该网络在编码器阶段构造了不同的特征提取模块,并融合不同路的特征信息提高模型的分割精度。该算法通过在解码器部分使用融合中间特征信息的方式,来保证模型不会因为过多的卷积操作而损害特征信息,这样既节约了内存占用,又保证了模型的分割精度。在Cityscapes上的实验结果表明,所提出的方法的分割精度可以达到67.7%,相较于同类语义分割模型具有较高的优势。本方法在分辨率为512×1024的图像上,处理速度为每秒111帧,远远超过了实时语义分割的最低标准。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

场景解析中基于注意力机制的实时语义分割算法研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

场景解析中基于注意力机制的实时语义分割算法研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：