基于区域感知的多尺度目标检测算法
Multi-Scale Object Detection Algorithm Based on Regional Perception作者机构:贵州大学计算机科学与技术学院公共大数据国家重点实验室贵阳550025 北京大学深圳研究生院信息工程学院广东深圳518055
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2023年第49卷第12期
页 面:178-185页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(61462014) 贵州省青年科技人才成长项目(黔教合KY字411)
主 题:目标检测 增强基线模型 通道信息增强 加权特征融合 多尺度目标
摘 要:针对目标检测网络主分支层的特征信息易丢失、不同尺度的特征表达能力不平衡等问题,提出一种基于区域感知的多尺度目标检测算法。在YOLOv5的基础上采用数据增强、改进的边框损失和非极大值抑制方法,构建1个更强健的基线模型,沿着通道方向使用全局最大池化、全局平均池化、卷积等操作设计通道信息增强模块,并分别作用于骨干网络的每个主分支层,使得各个检测头在特征融合过程中也不会丢失主分支层的关键特征,以强化模型对重点区域的感知能力。利用加权特征融合方法融合不同尺度的特征信息,平衡不同尺度的输入特征对输出特征的表达能力,进而提高模型对多尺度目标的感知能力,通过调整模型的通道和深度,设计4种不同规模的网络结构。实验结果表明,相比YOLOv5s,该算法在Pascal VOC、MS COCO、Global Wheat、Wider Face、Motor Defect 5个数据集上的平均精度均值分别提高5.48、3.00、1.94、0.70和1.95个百分点。同时,该算法的平均精度均值最高为50.7%,分别比YOLOv4和Dynamic Head的最大模型提高7.2和3.0个百分点。