基于反投影误差的全局最优PnP算法研究
作者单位:北方工业大学
学位级别:硕士
导师姓名:范涵奇
授予年度:2024年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
摘 要:PnP(Perspective-n-Point)问题在计算机视觉领域中起着至关重要的作用。PnP问题的核心在于,给定世界坐标系下的3D点集以及它们在二维图像平面上对应的投影点,如何通过求解透视投影关系来精确估计相机的位姿,包括旋转和平移。该技术在自主移动机器人、自动驾驶汽车和无人机等领域具有广阔的应用前景。 单目相机获取图像时往往受到光照、环境变化等多种因素的影响,导致图像中产生噪声。这些噪声会干扰透视投影关系的准确性,从而影响相机位姿估计的精度。本文针对这一问题,提出了一种新的位姿估计方法。首先,本文通过反投影将二维图像上的投影点映射回三维空间,这一过程中需要恢复深度信息。由于尺度不确定性,深度信息不能直接确定,但可以通过相机的外部参数以及已知的坐标点来间接获取。接下来,通过对涉及位姿参数的矩阵进行求导,成功地将平移矩阵表示为旋转矩阵与已知点坐标矩阵的乘积。这一推导过程最终形成了一个基于旋转矩阵的误差方程,然后,通过引入非单位四元数对旋转矩阵进行参数化,将原始的误差方程转化为一个四元四次方程。这种参数化方法简化了方程的求解过程,同时增强了算法的鲁棒性。为了求解这个四元四次方程,本文采用了Gr(?)bner基方法。Gr(?)bner基是一种在代数几何和多项式方程求解中广泛应用的工具,它能够有效地处理多元高次方程组的求解问题。通过Gr(?)bner基方法,得到了方程的数值解,并通过一阶牛顿优化进一步提升了位姿估计的精度。本文在MATLAB上进行了模拟仿真实验,结果表明,与其他PnP算法相比,本文算法在保持较高精度的同时,运算效率有显著提高。 为了验证本文提出的位姿估计算法在真实场景下的可行性和精度,本文将其集成到了开源框架中,并在真实数据集KITTI和Eu Ro C上进行了实验评估。实验结果表明本文提出的算法能够保持较好的稳定性,并且在大多数情况下都能够保持较高的精度。