咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于神经网络的复杂场景小目标检测算法研究 收藏
基于神经网络的复杂场景小目标检测算法研究

基于神经网络的复杂场景小目标检测算法研究

作     者:方成 

作者单位:长春理工大学 

学位级别:硕士

导师姓名:郝子强

授予年度:2022年

学科分类:08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0811[工学-控制科学与工程] 

主      题:深度神经网络 目标检测 多尺度可切换金字塔卷积算法 多尺度注意力实例分割算法 

摘      要:目标检测算法被广泛应用于交通管控,视频监控,无人驾驶以及医疗图像识别等任务,以上各种实际的应用场景中,由于场景复杂度高,目标在复杂背景下检测精度被干扰,小目标检测的速度较慢,同时特征提取与融合部分中对小目标的关注度不足,有效的小目标信息很难最终被检测器接收,因此小目标的检测更成为检测难题,其平均精度始终不超过25%。该文针对复杂场景中小目标检测精度不高,检测系统实时性较差等问题展开研究,主要研究工作和研究成果如下:1)提出一种基于特征金字塔的多尺度可切换空洞卷积SPC,将该模块与YOLOv4基线网络的Neck部分结合,在特征金字塔中构建出3-D卷积,使用不同步幅变化的共享卷积核对不同金字塔层级中相同目标进行检测,该模块对卷积层进行了优化,通过不同大小的卷积核对同一图像进行特征提取,再使用Switch函数对提取结果进行选择并整合,有效扩大了卷积核的视场,在多尺度上实现了对目标特征的重复观察。有效解决了小目标检测在复杂场景下特征提取困难、检测精度低的问题。随后应用改进后的focal loss损失函数进一步解决网络模型中样本分类数以及样本分布不均衡的问题。本文提出的方法在MS COCO数据集上表现良好,在Yolov4的基础上提升了5.4%的平均精度,达到了48.9%,在608×608的图像中FPS达到了29.6。2)在完成目标检测任务后,进一步改进系统使其进行更细微化的图像实例分割任务,基于U-net网络框架对YOLOv4网络进行改进,在head部分增加掩码分支以进行实例分割任务,设计出多尺度注意力模块并与YOLOv4 neck部分相结合,用以提高网络对小目标的实例分割分割精度。设计出一种用于实例分割的复合损失函数,达到同时解决样本不平衡以及网络过拟合的问题。该文提出的多尺度注意力-YOLOv4网络在MS COCO数据集上以24.6 FPS的获得了39.7%的平均分割精度,并且对小目标的检测结果达到了22.5%,相对于基线网络提升了2.0%。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分