基于多分支架构的目标三维位姿实时估计方法
Real-time estimation method of target 3D pose based on multibranch architecture作者机构:武汉大学测绘遥感信息工程国家重点实验室武汉430070 移动广播与信息服务产业创新研究院(武汉)有限公司鄂州436031 哈尔滨工程大学智能科学与工程学院哈尔滨150001
出 版 物:《中国惯性技术学报》 (Journal of Chinese Inertial Technology)
年 卷 期:2024年第32卷第4期
页 面:336-345页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:湖北省科技重大专项(2020AAA004) 海南省科技创新联合项目(2021CXLH0001)
主 题:多分支架构 三维位姿 目标检测 位姿估计 姿态四元数
摘 要:针对车路协同应用场景中目标尺度与位置值域跨度大导致的位姿实时估计精度低、回归求解模型收敛慢的问题,提出了一种基于多分支架构的目标三维位姿实时估计方法。在目标二维检测算法模型架构基础上,设计位姿估计分支结构,用于输出目标姿态四元数、目标相对相机的三维空间位置及目标长宽高。在训练阶段,为位姿估计分支设计了相应的损失函数,采用向量单位化算子回归姿态四元数、对数重映射算法回归目标尺寸与目标到相机距离;在推理阶段,根据模型输出的四元数和目标到相机距离解算出目标三维位姿,实现精确的位姿估计。在OVRC数据集的位姿精度验证中,位置坐标误差的均方差最大为1.94 m,姿态角误差的均方差最大为3.98°;在Kitti数据集的相对精度测试实验中,相比PVNet方法,检测精度提升了3.22%,相比3DBB方法,推理效率提升一倍。