基于最优传输理论的三维点云场景流估计方法研究
作者单位:燕山大学
学位级别:硕士
导师姓名:林洪彬
授予年度:2023年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
摘 要:随着激光雷达传感器的发展和广泛应用,点云数据的采集成本显著降低,点云成为机器视觉任务中的主流数据类型。点云的场景流能够描述物体的三维运动信息,场景流估计任务也受到越来越多的关注。然而,现有的场景流估计方法在对点云进行全局匹配时搜索范围大计算成本高,在提取点云特征时,现有方法也并未考虑点云间的关联信息,导致出现一些错误和异常匹配,降低了网络的估计精度。针对上述问题,本文改进了基于最优传输理论的场景流估计方法,主要工作包括以下几个方面:首先,针对现有场景流估计方法大多采用全局匹配,计算复杂度高、精度与可靠性得不到保障的问题,提出一种基于最优传输的区域点云场景流估计方法。为解决点云特征提取问题,设计一种基于Point Net++的点云数据特征提取模块;为解决全局匹配中点云搜索范围大导致的噪点问题,设计一种根据关键点划分区域的区域场景流估计模块;为解决区域估计法中近邻点场景流相差较大的问题,设计了基于点云邻域一致性的场景流优化模块;在经典的Flying Things3D和KITTI数据集上开展实验研究,验证该方法在大规模点云场景流估计中的有效性。其次,针对Transformer结构在点云应用中缺乏对点云内部几何结构特征的关注,以及深度学习中的模型可解释性问题,本文提出了一种新的FPFH-Transformer结构,将传统点云特征快速点特征直方图与Transformer结构相结合,在学习点云内部和点云间关联特征时不丢失点云原有的几何特征,进一步提升对点云特征的提取能力。最后,针对现有场景流估计方法在提取点云特征时丢失了点云间的关联信息,本文提出一种融合FPFH-Transformer结构的点云场景流混合估计方法,通过该模块学习关键点云内部各点和点云之间的关联信息,提高关键点匹配精度;为了解决区域估计法中区域内各点场景流估计值对单一关键点的依赖性,设计了一种点对多块的场景流估计方法;提出了一种能够全面衡量场景流估计值与真实值之间差异的综合损失函数,在Flying Things3D和KITTI数据集上的实验表明了混合估计法的优越性能。