基于检测增强型YOLOv3-tiny的道路场景行人检测
Road scene pedestrian detection based on detection-enhanced YOLOv3-tiny作者机构:武汉理工大学现代汽车零部件技术湖北省重点实验室湖北武汉430070 武汉理工大学汽车零部件技术湖北省协同创新中心湖北武汉430070
出 版 物:《江苏大学学报(自然科学版)》 (Journal of Jiangsu University:Natural Science Edition)
年 卷 期:2024年第45卷第4期
页 面:441-448页
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
基 金:“211工程”专项资金资助项目(40120411) 高等学校学科创新引智计划项目(B17034) 教育部创新研究团队发展计划项目(IRT_17R83)
主 题:行人检测 深度学习 卷积神经网络 非对称最大池化 激活函数 自注意力机制 多尺度检测 YOLOv3-tiny
摘 要:为了给驾驶员提供实时准确的行人信息、减少交通事故的发生,提出一种检测增强型YOLOv3-tiny(detection of enhanced YOLOv3-tiny,DOEYT)行人检测算法.创建鲁棒的特征提取网络,首先使用非对称最大池化进行下采样,防止随着感受野增大行人横向特征的丢失;其次使用Hardswish作为卷积层的激活函数优化网络性能;最后使用GC(globe context)自注意力机制获得全文特征信息.在分类回归网络部分,采用三尺度检测策略,提升小尺度行人目标的检测精度;使用k-means++算法重新生成数据集锚框,提高网络收敛速度.构建行人检测数据集并分为训练集和测试集,对DOEYT算法的性能进行试验验证.结果表明,非对称最大池化、Hardswish函数、GC自注意力机制分别使平均准确率AP提高14.4%、7.9%、10.8%;DOEYT算法在测试集上检测的平均准确率高达91.2%,检测速度为103帧/s,可见该算法可快速准确地检测行人,降低交通事故发生的风险.