基于改进的轻量化YOLO目标检测模型研究
作者单位:吉林化工学院
学位级别:硕士
导师姓名:王威娜
授予年度:2024年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:计算机视觉 目标检测 YOLO算法 注意力机制 大核卷积
摘 要:目标检测属于计算机视觉的子任务,它旨在利用神经网络对计算机摄像头等设备捕捉的视频、图像中的画面进行训练和学习,进而完成识别特定目标对象的任务。目标检测在实际生活中已具有广泛的应用,但其依然存在诸多挑战:检测过程中存在的错检、漏检、重复检测等问题;检测精度仍不满足实际需求,有待进一步提高;主干网络参数量巨大,限制了模型的应用。针对上述问题,本文提出两种以YOLO算法为基准的改进目标检测网络,具体内容如下: (1)提出基于大核卷积的轻量化目标检测模型。首先,提出含有大核卷积的特征编码模块,用以提升网络对输入图像特征编码的能力;其次,提出通道增强模块,将网络模型编码结构中的维度提升,使编码结构能够容纳更多的特征信息;然后,提出含有大核卷积的注意力机制,使得模型在海量特征信息中能够聚焦到更加重要的特征信息;最后,引入SIOU损失函数,克服模型在训练时产生的角度漂移问题,使模型在训练过程中收敛更快、精度更高。实验结果表明,与其他同类算法相比,提出的目标检测网络在保持较小参数量的同时,模型准确率在不同数据集上均有明显提升,并通过消融实验验证了所提创新点的有效性。 (2)提出基于编码增强和通道增强的目标检测网络。首先,提出基于大核卷积的编码增强模块用以提高语义特征捕获能力,并利用深度卷积减少参数量计算量;然后,构建通道增强模块,置于编码增强模块之前,使得模型能够在更高维度上对输入特征进行编码。最后,改进损失函数,引入WIo U用以减小数据集中低质量标注框给模型带来的有害影响。实验结果表明,与其他同类算法相比,提出的目标检测网络有效地提升了模型精度,进一步通过消融实验表明了所提创新点的有效性。