室内动态场景下基于立体视觉的SLAM系统研究
作者单位:南京理工大学
学位级别:硕士
导师姓名:樊卫华
授予年度:2022年
学科分类:080202[工学-机械电子工程] 08[工学] 080203[工学-机械设计及理论] 0804[工学-仪器科学与技术] 0802[工学-机械工程]
主 题:移动机器人 SLAM 动态目标剔除 实例分割 语义地图
摘 要:近年来,移动服务机器人逐渐开始出现在人们的生活中。机器人智能化的关键技术之一,同时定位及建图(SLAM)成为了机器人领域的热点问题。到目前为止,已经有学者提出了比较成熟的视觉SLAM方案,但动态环境中定位精度较差的问题仍然没有得到解决。鉴于此,本文主要针对室内动态场景下基于立体视觉的SLAM技术进行研究,提出了适用于动态环境且能获取周围环境语义信息的SLAM系统方案。首先在ORB-SLAM2算法的基础上提出本文系统的总体框架。对原ORB-SLAM2框架流程及模块功能进行分析,针对原框架在动态环境下鲁棒性较差、无法获取周围环境语义信息和所构建点云地图过于稀疏的三个问题,提出本文改进的系统方案。针对动态环境下相机位姿估计误差较大的问题,本文提出一种结合语义信息和几何约束去除动态特征点的视觉里程计算法。针对特征点聚集的问题,在ORB算法基础上提出基于网格划分的自适应阈值特征点提取算法,更全面地获取图像信息。然后结合图像语义信息和L-K光流法粗滤除动态特征点,用粗滤除后的图像估计基本矩阵F,根据该矩阵计算极线距离并精滤除特征点。在TUM的动态数据集上测试算法,实验结果表明本文算法能有效剔除动态物体上的特征点,进而提升位姿估计精度。针对生成地图缺乏环境语义信息的问题,本文提出在原ORB-SLAM2框架基础上增加一个用于提取语义信息的实例分割线程。为保证SLAM系统的实时性,本文选择分割速度较快且精度较高的YOLACT网络对RGB图像进行语义标注,并在实际环境中检测其有效性。提取结果既用于运动一致性检查,又与点云地图融合生成三维语义地图。针对原框架只能生成稀疏点云地图的问题,本文提出一种基于绘图关键帧的三维稠密语义地图构建算法。根据筛选出的绘图关键帧生成单帧点云,并利用图像信息和估计位姿进行全局拼接,生成三维点云地图。然后进行数据关联,将语义信息与点云地图融合,并转化成八叉树地图保存。最后在现实场景中基于实验平台Ty Ran部署系统并进行实验,验证了本文设计的SLAM系统算法的可行性及有效性。