咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于注意力机制和倒置残差模块的目标检测算法研究 收藏
基于注意力机制和倒置残差模块的目标检测算法研究

基于注意力机制和倒置残差模块的目标检测算法研究

作     者:韩宇 

作者单位:山东师范大学 

学位级别:硕士

导师姓名:李天平

授予年度:2024年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:目标检测 倒置残差模块 注意力机制 YOLOv5 

摘      要:利用计算机技术完成目标检测,一直是图像领域的热点问题。基于深度学习方法的网络模型可以提取更丰富的特征,映射复杂的非线性关系。目前,在处理复杂场景时,现有的目标检测算法往往难以有效地在检测精度、处理速度和模型复杂度三者之间实现平衡。鉴于此,本研究旨在通过提出两种新型目标检测算法,来优化这三方面的权衡。这些算法采用了简化的架构,并融合了倒置残差结构和注意力机制的理念,旨在增强模型的特征提取效率并降低其复杂度。以下是本文的核心研究内容: (1).针对无锚检测算法在精度方面的不足及有锚检测算法在速度上的局限,本研究提出了一个新型的无锚检测算法,命名为CFINet,该算法结合了倒置残差结构与注意力机制。CFINet主要由注意力机制模块、特征增强模块,以及倒置残差模块构成。首先,通过引入注意力机制模块减轻因降低通道数而引起的特征信息损失,使模型能够专注于图像中的关键目标,并融合目标层的上下文信息。接着,本文在特征金字塔的自上而下传递过程中融入了特征增强模块(Feature Enhancement Module,FEM),以实现更深层次的特征抽取和层间信息的有效交流,从而提升检测准确性。最终,通过采用倒置残差结构改进的轻量化检测头替换常规检测头,简化了模型结构,降低了模型复杂度。实验结果表明:CFINet在PASCAL VOC和MS COCO 2017公开数据集上分别以80.5%、38.8%的m AP实现了检测精度与检测速度之间的权衡。 (2).对YOLOv5在目标检测中特征提取能力不足的问题,本研究提出了改进型的YOLOv5目标检测算法,称之为HP-YOLOv5。该算法主要构建在颈部和头部结构上。初始阶段,通过在骨干网络中融合注意力机制模块,算法能够有效捕获目标的关键信息,从而提升检测精度。其次,在颈部结构中集成倒置残差模块,旨在降低计算负担并增强特征的表达能力。此外,算法在头部设计中加入了新型的10×10尺寸预测头,并在每个预测头之前配备特征增强模块,以便更准确地预测大型目标。最终,为了降低预测框与实际框之间的偏差,采用DIo U损失函数替换传统的GIo U损失函数,进一步优化了目标定位的准确性。实验数据显示,HP-YOLOv5在MS COCO 2017及PASCAL VOC数据集上经过100个训练周期,分别达到了58.4%和84.6%的平均精度(m AP),标志着其在检测性能上的卓越表现。该模型不仅在训练阶段展现了高效性,同时也确保了检测过程的实时性和准确性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分