咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于改进YOLOv3的目标检测模型研究与应用 收藏
基于改进YOLOv3的目标检测模型研究与应用

基于改进YOLOv3的目标检测模型研究与应用

作     者:过铭涛 

作者单位:南京邮电大学 

学位级别:硕士

导师姓名:徐鹤

授予年度:2022年

学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 

主      题:目标检测 空间金字塔池化 注意力机制 半精度加速 模型剪枝 

摘      要:基于深度学习的卷积神经网络是当前目标检测利用的最为流行的方法之一。目标检测作为计算机视觉领域的一个重要分支,被广泛应用于自动驾驶、工业检测等生产活动中,通过目标检测算法可显著节约人力、物力成本,提高生产效率。并且目标检测是实例、全景分割等高层次计算机视觉任务的前置条件。YOLOv3作为目标检测技术中最为流行的算法之一,具有强的泛化能力。然而,当前自动驾驶领域涉及的算法存在精度差、部署难等问题,因此本文将从提高检测精度、压缩模型参数两个方面对目标检测算法进行研究,以YOLOv3为基础进行改进。本文主要工作如下:(1)在提高模型检测精度方面,本文首先采用空间金字塔池化来对图像中的局部特征和全局特征进行融合,从而更好地丰富特征图的表达能力,对于图像中大小差异较大的目标能够更加有效地检测;其次,在特征图中加入注意力机制对每个通道进行加权操作,增强关键特征,去除冗余特征,从而提高特征网络对目标物体和背景的辨别能力;最后,根据K-means聚类算法和GIoU损失函数得出的anchor box来拟合得出最终的预测框,完成对目标车辆和行人的定位与识别。实验结果表明,所提方法在KITTI数据集上达到了91.4%的m AP(精度均值),83.2%的F1分数,速度达到了45.3FPS(每秒帧数),检测性能在精度和速度上都优于传统的YOLOv3。(2)在模型压缩方面,本文首先采用Depth-Wise卷积组合而成的G-Module构建整个模型的主干网络,并在主干网络中加入注意力机制对每个通道进行加权操作,增强关键特征,去除冗余特征,从而提高特征网络对目标物体和背景的辨别能力;其次,利用Batch Normalization层中缩放因子gamma的大小将通道进行删减,达到压缩模型大小并提升运算速度的效果;最后,基于NVIDIA的Tensor RT框架进行了模型转化和半精度加速,将加速后的模型成功部署到嵌入式平台Jeston Nano上。实验结果表明,在KITTI数据集上,本章所提方法的推理速度约为原模型的5倍,参数体积缩小为十分之一。(3)设计并实现了基于改进YOLOv3模型的车辆行人目标检测原型系统。对该目标检测原型系统,分析了其使用的软硬件条件,将本文提出的改进YOLOv3模型进行实现与部署,给出了在相关数据集下该系统的识别性能测试,验证了算法的可行性和有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分