融合时空交互的轨迹预测方法研究
作者单位:北京邮电大学
学位级别:硕士
导师姓名:刘绍华
授予年度:2022年
学科分类:080202[工学-机械电子工程] 08[工学] 0804[工学-仪器科学与技术] 0802[工学-机械工程]
摘 要:轨迹预测技术是指模型根据车辆、机器人、行人的历史运动状态,预测目标在未来一段时间内的运动轨迹。在许多应用中,该技术也是一项重要且具有挑战性的任务(例如,机器人导航、自动驾驶以及智能监控系统)。无人驾驶车辆、智能运动机器人在复杂场景中安全运行的关键是可以对邻近行人与车辆的运动意图进行分析,进而规划一条安全合理的未来移动轨迹,避免交通事故的发生。由于行人不是只受牛顿定律影响的实体,无法用简单的运动学公式对行人的未来轨迹进行建模,因此人们开始利用深度学习的方法进行轨迹预测的问题研究。但现有方法遇到了许多挑战,具体存在以下两个问题:一是运动交互的建模冗余问题,现有方法大多使用成对的注意力机制对交互进行建模,当场景中行人数量过多时,行人之间的重要性区分度变小,且建模方式单一,无法使用不同的方式捕捉个体和群体之间的交互信息。二是目标意图的建模不充分问题,现有方法忽略了行人意图的动态变化过程,导致观测阶段只结合行人最终固定的意图进行编码,并且没有充分利用行人随运动而变化的意图信息。为了解决上述问题,本文围绕融合时空交互的轨迹预测方法进行研究,分别从行人运动交互、时域交互融合、空间场景交互以及目标意图交互四个方面进行探索。首先,为了模拟行人之间的空间交互,解决大场景下行人数量过多时的建模冗余问题,本文提出了一种多精度的交互模型,该模型包含了一个新颖的多区域交互模块来捕获全局交互,以及一个额外的局部交互模块来模拟行人在局部邻域内的交互,同时提出了一种基于注意力机制的时间域交互融合方法,对时域交互信息进行整合。实验结果表明,在ETH-UCY公开数据集上,本文方法得到的结果与STAR模型相比ADE(Average Displacement Error)误差降低了 3.8%,FDE(Final Displacement Error)误差降低了 13.2%。其次为了充分利用行人的意图信息,本文提出一种多维度的行人轨迹数据表示方式,替代传统的行人二维坐标表示方法,帮助理解行人运动过程中所处的区域信息,更好地挖掘行人运动的粗精度信息。最后,为了建模行人的目标意图交互并考虑空间场景交互的影响,本文提出行人意图动态分析子网络,利用多维度的数据输入引入三个子任务损失函数,帮助识别重要的场景区域,动态结合场景信息,并利用注意力机制将子网络与主网络的信息融合,辅助网络同步更新。实验结果表明,在ETH-UCY公开数据集上,本文方法得到的结果与Trajectron++模型相比ADE误差降低了 9.6%,FDE误差降低了 12.2%,另外本文采用召回率指标对区域打分模块进行评估,在召回Top 1分数样本时的召回率为68.6%,召回Top 6分数样本时的召回率为99.6%。