ResFPN:扩增实际感受野和改进FPN的多尺度目标检测方法
作者机构:宁夏大学信息工程学院 宁夏“东数西算”人工智能与信息安全重点实验室
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2024年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(61966029) 宁夏回族自治区重点研发计划(2021BEB04065)
主 题:目标检测 卷积神经网络 多尺度目标检测 感受野 FPN
摘 要:针对多尺度目标检测中主干网络实际感受野远远小于理论感受野、感受野分布稀疏以及FPN特征金字塔在横向连接过程中统一通道数丢失通道信息等问题影响模型的性能,提出ResFPN:一种扩增实际感受野和多特征融合改进FPN的多尺度目标检测算法。针对主干网络实际感受野远远小于理论感受野,设计了多分支膨胀卷积MBD模块和多分支池化MBP模块,通过学习不同尺度空间特征融合,扩增感受野。针对感受野分布稀疏问题,提出轻量级通道交互融合CIF模块,通过双分支结构并在每一分支叠加不同数量深度可分离卷积学习像素间的依赖关系增强特征表示。针对FPN通过1×1卷积统一通道数会丢失通道信息问题,尝试利用SubPixel卷积提取C5层输出特征,保留原始丰富语义信息同时引出额外双向路径对FPN通道信息进行补充,但这可能会产生冗余信息。因此,在额外双向路径后引入全局上下文GC模块,利用GC瓶颈转换模块进一步融合特征信息,减少信息冗余。实验表明,本文提出的ResFPN有效的解决了感受野分布稀疏问题并将主干网络感受野增大了原来的一倍,同时提出改进FPN通道丢失问题的方法也在多尺度目标检测中获得了良好的性能。具体来说,与典型的网络Faster-RCNN相比,大、中、小物体检测平均精度在具有挑战性的MS COCO数据集上分别提高了2.2%,1.6%,2.0%,与其他检测器相比检测效果也有提升。