基于深度学习的三维计算机视觉下的6D姿态估计
学位级别:硕士
导师姓名:张涌;宁立
授予年度:2021年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:随着近些年计算机视觉研究的不断进步,三维计算机视觉不断地得到应用和发展,而6D姿态作为三维计算机视觉中的一个重要的方向,其融入到我们生活的方方面面之中。例如,自动驾驶,增强现实(AR),机器人应用等等。鉴于以上的背景,在本文中将要解决两个主要的工作内容:(1)基于深度学习的6D姿态估计算法研究;(2)基于6D姿态估计的机器人定位方法研究。针对第一点的工作,本文提出了使用特征选择机制(Feature Selecting Mechanism,简称FSM)网络结构的端到端6D姿态估计的神经网络。而本文对特征选择机制(FSM)网络结构提出了两种方案:第一种方案是人工调整比重方案,第二种方案是网络自动调整比重方案。通过与已有方法Pose CNN网络和Dense Fusion网络,在三种数据集,即Line MOD数据集,YCB-Video数据集,以及自制的Synthetic Image数据集下进行对比实验。由实验结果来看,本文所提的网络自动调整比重方案在多种数据集的实验设置下都能达到较好甚至最好的实验效果,例如在Line MOD数据集下,平均准确率相比于Pose CNN网络提高了8.1%,相比于Dense Fusion网络提高了2%。在YCB-Video数据集下,相比于Dense Fusion网络提高了1%。在自制的Synthetic Image数据集下,相比于Dense Fusion网络提高了1.9%。针对第二点的工作,本文提出了将第一点工作所提出来的网络自动调整比重方案迁移至机器人平台,进行基于6D姿态估计的机器人定位方法的研究。然后通过在三种情况下进行实验,实验所展示的效果表明该部分所提出的方法具有一定的有效性和能应用于多个场景的稳定性。