基于RGB-D的室内场景分割技术研究-南通市图书馆

文献详情 >基于RGB-D的室内场景分割技术研究收藏

基于RGB-D的室内场景分割技术研究

作者：靳瑜昕

作者单位：中北大学

学位级别：硕士

导师姓名：杨晓文

授予年度：2023年

学科分类：08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]

主题：RGB-D图像深度学习室内语义分割多模态融合多尺度融合

摘要：随着人工智能、计算机硬件等技术的发展,应用深度学习解决计算机视觉领域的相关问题已逐渐普遍化。作为计算机视觉领域中图像处理的关键步骤,图像语义分割在智能交通、医学诊断等越来越多的领域得到应用,因此研究图像语义分割具有重要意义。室内场景的结构较为复杂,RGB图像提供的颜色信息会使色彩相近物体间的边界模糊,而深度图像可以为RGB图像提供相应的几何关系,结合深度图像能够有效提高分割效果,因此基于互补的RGB和深度图像的语义分割逐渐成为图像处理领域的研究热点。本文研究了基于RGB-D图像的室内场景语义分割技术,主要研究内容如下:(1)阐述了深度学习在RGB-D图像分割领域应用时的相关理论知识,分析目前RGB-D语义分割在多模态融合以及多尺度融合方面存在的问题,并针对以上问题展开研究;(2)由于RGB图像和深度图像存在的差异性和互补性,针对如何有效融合两种模态信息,提出了一种注意力引导多模态交叉融合的分割网络ACFNet。首先,采用编码器-解码器结构,设计非对称双流特征提取网络,并在RGB编码器中添加全局-局部特征提取模块(GL);其次,提出了注意力引导多模态交叉融合模块(ACFM),有效融合RGB和深度特征,更好地在多阶段利用融合的增强特征。实验结果表明,ACFNet网络显著提高了室内场景的分割效果;(3)针对室内场景中目标物体尺寸不一的问题,提出一种融合编码器多尺度特征的RGB-D语义分割网络EMFNet。首先,提出了结合池化操作的多尺度特征融合模块(PMFM),有效利用了编码器阶段提取的多尺度特征;其次,设计了多重跳跃连接模块(MSCM),重新利用了下采样过程中缺失的细节信息。实验结果表明,EMFNet网络优于ACFNet及对比的其他语义分割方法。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于RGB-D的室内场景分割技术研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于RGB-D的室内场景分割技术研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：