基于稀疏可学习proposal的车间工具目标检测
Target detection of workshop tools based on sparse learnable proposal作者机构:江苏海洋大学电子工程学院连云港222005
出 版 物:《电子测量与仪器学报》 (Journal of Electronic Measurement and Instrumentation)
年 卷 期:2024年第38卷第7期
页 面:13-21页
核心收录:
学科分类:0809[工学-电子科学与技术(可授工学、理学学位)] 081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:工具检测 稀疏可学习 多尺度特征 Swin-Transformer 多头注意力
摘 要:针对车间工具不同型号之间尺寸存在较大差异、形状种类繁多等问题,提出了一种基于稀疏可学习proposal的车间工具检测算法。首先,融入稀疏表示和可学习的proposal机制来提升模型的鲁棒性,并减少检测过程中所需的参数量;其次,引入Swin-Transformer结构,旨在增强模型的全局以及细节学习能力,有效地解决传统卷积神经网络在高层语义信息融合方面存在的不足;然后,使用一种改进的多尺度特征融合网络架构,通过有效融合不同尺度的特征,提高了模型对于各种尺度目标的检测能力;最后,将多头注意力和动态卷积结合,在不同特征层之间建立更精确且细致的联系,从而进一步提升了目标检测的准确性;采用了CIoU损失函数,通过综合考虑位置、尺度和形状信息,使得模型对边界框的回归预测更加全面与准确。实验结果显示,本文算法在车间工具目标检测任务上的平均检测精度达到了91%,较当前主流算法至少提升了2.3%以上。同时,单张图片的检测速度大约为53 ms,满足了实时检测的需求,体现了综合性能优越。