基于体素自注意力辅助网络的三维目标检测
作者机构:西华大学汽车与交通学院 西华大学汽车测控与安全四川省重点实验室 四川省新能源汽车智能控制与仿真测试技术工程研究中心
出 版 物:《激光与光电子学进展》 (Laser & Optoelectronics Progress)
年 卷 期:2024年第24期
页 面:151-160页
核心收录:
学科分类:080904[工学-电磁场与微波技术] 0809[工学-电子科学与技术(可授工学、理学学位)] 08[工学] 0810[工学-信息与通信工程] 082304[工学-载运工具运用工程] 081105[工学-导航、制导与控制] 080204[工学-车辆工程] 081001[工学-通信与信息系统] 0802[工学-机械工程] 081002[工学-信号与信息处理] 0825[工学-航空宇航科学与技术] 0811[工学-控制科学与工程] 0823[工学-交通运输工程]
基 金:四川省科技创新基地建设项目(2022ZYD0125) 自然科学青年科学基金(52205129)
摘 要:针对目前依赖于卷积神经网络(CNN)的激光雷达目标检测算法对自动驾驶场景的空间结构理解不深刻导致检测效果差的问题,提出了一种能够增强特征提取能力、可直接应用于大部分基于体素的检测算法的体素自注意力辅助(VSAA)网络。首先,VSAA网络在体素特征编码的基础上进一步构造体素哈希表对体素进行二次编码,在后续自注意力计算过程中有效提高了搜索相关体素的效率;然后,VSAA网络将自注意力机制应用到体素层面,从而获取到丰富的全局信息和深层次的上下文语义信息;最后,将VSAA网络应用在基准算法SECOND和PV-RCNN上,进而提出了VA-SECOND和VA-PVRCNN算法,并通过融合VSAA网络与CNN特征弥补了CNN感受野小的缺点,增强了检测算法对整个空间场景的理解能力。在KITTI数据集上的实验结果表明:相比于基准算法,VA-SECOND和VA-PVRCNN算法对所有检测目标的平均检测精度分别提高了1.16百分点和1.54百分点,证明了VSAA网络的有效性。