双注意力机制的多模数据融合的三维目标检测
A 3D object detection based on multi‑modal data fusion with dual attention mechanism作者机构:江南大学人工智能与计算机学院江苏无锡214122 江南大学江苏省模式识别与计算智能实验室江苏无锡214122
出 版 物:《武汉大学学报(工学版)》 (Engineering Journal of Wuhan University)
年 卷 期:2024年第57卷第8期
页 面:1169-1175页
核心收录:
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
基 金:国家自然科学基金项目(编号:61806006) 江苏省研究生创新计划项目(编号:KYLX16_0781) 江苏高校优势学科建设工程资助项目(编号:PAPD)
摘 要:针对点云稀疏性和单模态数据信息不足导致远小物体检测困难的问题,提出了一种双注意力机制的多模态数据融合的三维目标检测算法。首先,设计了一种体素多邻域特征提取器,扩大体素感受野,融合体素多个上下文信息,以提高体素特征对物体空间结构和语义信息的表征能力及提高特征鲁棒性;其次,提取了体素的图片多层语义特征,底层结构特征和高层语义特征分别保留目标位置信息和语义信息,以增强体素特征;最后,设计了一种多模态特征融合,使用通道注意力自适应融合不同模态特征,使用体素注意力增强有效目标物体特征表达、抑制无用背景物体特征表达。在KITTI(Karlsruhe Institute of Technology and Toyota Technological Institute)数据集上的实验结果表明,在远小物体检测上,所提方法较现有多个主流单模态方法和多模态方法取得了较大的性能提升。