咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习的目标检测算法研究 收藏
基于深度学习的目标检测算法研究

基于深度学习的目标检测算法研究

作     者:杨卫 

作者单位:中国民航大学 

学位级别:硕士

导师姓名:刘浩翰;惠康华;朱晓星

授予年度:2023年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:YOLO 目标检测 多尺度卷积 多维特征融合 自适应锚框 稀疏性惩罚 

摘      要:目标检测旨在判别当前输入图像中目标的位置及所属类别,是计算机视觉领域的热门研究方向之一,被广泛应用在军事、交通、航空航天、工业、自动驾驶等领域。在小目标、弱特征等一系列的复杂场景下,检测任务常常存在很多挑战。因此,准确完成各种目标检测任务,意义重大。根据YOLO系列模型快速高效,适用于实时目标检测,具有较高的准确率和较低的计算复杂度的特点,本文分别在YOLOv5、YOLOv7上针对多尺度特征提取和多维特征信息融合两个方向开展研究。第一,针对复杂场景下初始锚框难以匹配目标及多尺度检测能力不强的问题,提出基于YOLOv5的增强多尺度目标检测方法(EM-YOLOv5)。通过Kmeans++聚类算法,获得适应当前检测场景下的多尺度初始化锚框,使得网络更容易捕捉到不同尺度目标;在Bottleneck结构中增加多条不同尺度的并行卷积支路,在保留原有特征信息的同时融合多尺度的特征信息,增强模型的全局感知能力。第二,针对复杂场景下小目标聚集且可利用特征少的问题,提出基于YOLOv7的多维特征信息融合目标检测方法(Mdfif-YOLOv7)。通过增加小目标检测层,并利用Transformer全局感知能力,引入多头注意力机制,对检测层进行多维特征信息融合,增强模型对小目标感知能力;在高维卷积中,通过稀疏性惩罚策略,增强显著特征信息权重,提升模型对高级语义特征的辨知能力。最后,在Vis Drone2019、COCO2017、PASCAL VOC2012等多个数据集上对提出的改进模型进行验证。与原算法相比,m AP@0.5:0.95、m AP@0.5等关键指标均有一定提升。在PASCAL VOC2012上,相较于YOLOv5s,EM-YOLOv5s在m AP@0.5:0.95上提升5.2个百分点;在Vis Drone上,相比于YOLOv7,Mdfif-YOLOv7在m AP@0.5:0.95提升3.2个百分点。实验结果表明,改进策略可帮助模型在小目标、弱特征等一系列复杂场景下提取更具鉴别力的信息,从而帮助模型获得更好的检测性能。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分