改进的YOLOv5图书梯标检测算法
Improved YOLOv5 for book ladder label detection algorithm作者机构:桂林理工大学计算机科学与工程学院广西桂林541006 桂林理工大学物理与电子信息工程学院广西桂林541006
出 版 物:《桂林理工大学学报》 (Journal of Guilin University of Technology)
年 卷 期:2024年第44卷第2期
页 面:330-338页
学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 13[艺术学] 08[工学] 081104[工学-模式识别与智能系统] 0804[工学-仪器科学与技术] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程]
摘 要:对于印刷行业而言,确保每本书的页码、页面正确排序是提高印刷厂生产率的重点。为了解决目前印刷厂对于图书梯标的检测存在漏检、误检的问题,提出了一种改进YOLOv5的梯标检测算法。该算法增加一个检测尺度以解决漏检问题和提高梯标的识别精度,将主干网络中的C3数量减少,使用深度可分离卷积替代颈部网络中的部分卷积,在能够保证精度稳定的同时降低模型的参数量和计算量;使用SPConv替换Resunit结构里的Conv,形成SPConv-C3结构,SPConv-C3结构不仅能够降低模型的参数量,还能提升网络对图书梯标的检测精度;根据深度可分离卷积和SPConv-C3结构设计特征融合网络结构,能够大幅度提升网络模型的特征融合能力。将所改进的检测算法在自建数据集上进行验证,结果表明,改进后的算法Pm,A@0.5∶0.95达到了64.7%,比原YOLOv5s提高7.5百分点,参数量下降了3.16%,能够满足实际需求。