基于轻量级YOLOv5算法的运动物体位姿预测及抓取系统研究
作者单位:黑龙江大学
学位级别:硕士
导师姓名:石勇
授予年度:2024年
学科分类:08[工学] 080202[工学-机械电子工程] 080203[工学-机械设计及理论] 0804[工学-仪器科学与技术] 0802[工学-机械工程]
主 题:运动物体 抓取 YOLOv5 门控循环单元 长短期记忆
摘 要:随着机械手抓取技术的不断发展,其与日常生活、工业生产、医疗手术等多种领域的关联越加密切,机械手抓取系统也在自动化、智能化的道路上不断提高,抓取目标也由静态向动态转变,且类别不再单一,变得多样化。检测、识别目标物体是机械手抓取系统的基本任务,通过检测和识别获取目标物体信息的完善程度对机械手抓取任务有着不可忽视的影响。目标物体信息包含姿态、尺寸、位置以及类别等,抓取任务中姿态信息通常指目标物体的倾斜角度。常用的目标检测算法一般使用水平检测框,在姿态信息的检测中表现并不理想,为了更好地获得目标物体的姿态信息越来越多的图像分割算法被用于抓取任务。对于动态物体抓取,通常需要对目标物体的信息进行预测,而这些预测算法往往是建立在图像信息的基础上。无论是图像分割算法还是基于图像信息的预测算法都需要较多的计算资源,大多数用于抓取任务的控制系统并不具有足够的计算资源。因此,本研究针对目标检测算法进行改进,将基于图像信息的预测算法替换为时间序列预测算法,提出一种占用计算资源较少的运动物体自主识别及位姿预测机械手抓取系统。 研究从参数量(Param)和计算量(FLOPs)两方面进行抉择,采用YOLOv5-nano模型作为目标检测的基础模型。为了使目标检测算法具有检测姿态信息的能力,本研究提出两种可行方案:第一种方案用两个水平检测框确定整体与关键特征的对应关系;第二种方案对目标检测算法进行基于CSL方法的旋转检测框改进。 针对使用图像信息预测目标物体的位姿会占据较多计算资源的问题,本研究提出基于注意力机制改进的GRU模型和LSTM模型,为了提高模型的预测能力。 最后,本研究建立目标检测算法以及预测算法的数据集,在ROS系统中进行仿真实验,并对目标检测算法、位姿预测算法以及机械手抓取系统进行验证和测试。组合不同目标检测模型和位姿预测模型后,得到多种目标检测及位姿预测模型。用这些模型对四个类别的物体进行目标检测和位姿预测测试,得到误差最小的三种组合模型,再使用这三种组合模型控制机械手进行抓取实验。最小预测误差为4.528 mm,三种组合模型的抓取实验结果分别为93.14%,94.12%,92.16%。实验数据表明,本研究的机械手抓取系统采用占用计算资源较少的算法,仍能够较好地完成运动物体抓取作业。该系统能够适应大多数控制系统的硬件设备,在多种环境下广泛应用。