基于改进YOLOv8和GMM图像点集匹配的双目测距方法
Binocular ranging method based on improved YOLOv8 and GMM image point set matching作者机构:长安大学能源与电气工程学院陕西西安710018 比亚迪汽车有限公司陕西西安710119 长安大学电子与控制工程学院陕西西安710061
出 版 物:《图学学报》 (Journal of Graphics)
年 卷 期:2024年第45卷第4期
页 面:714-725页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:陕西省秦创原“科学家+工程师”队伍建设项目(2024QCY-KXJ-161) 西安市重点产业链项目(23ZDCYJSGG0013-2023)
主 题:YOLOv8目标检测 高斯混合模型 点集匹配 深度学习 双目视觉 智慧工地可视化
摘 要:针对无人塔吊系统的研究需求,提出一种基于改进YOLOv8和GMM图像点集匹配的双目测距方法,对驾驶室外环境中的塔吊吊钩进行检测识别并测距。通过双目摄像头进行图像采集,引入FasterNet骨干网络和Slim-neck颈部连接层,对YOLOv8目标检测算法进行改进,有效检测画面中的塔吊吊钩并获取检测框的二维坐标信息;采用局部敏感哈希方法,并融合分阶段匹配策略,提升GMM图像点集匹配模型的匹配效率,针对检测框中的塔吊吊钩,进行特征点匹配;最后通过双目相机三角测量原理计算得出塔吊吊钩的深度信息。实验结果表明,改进后的YOLOv8算法与原算法相比,精确率P提高了2.9%,平均精度AP50提高了2.2%,模型复杂度降低了10.01 GFLops,参数量减少了3.37 M,在提升检测精度的同时实现了模型的轻量化。改进后的图像点集匹配算法与原算法相比,各个指标表现出更加良好的鲁棒性。最后在工程现场对塔吊吊钩进行识别与测距,误差可接受范围内有效完成了塔吊吊钩的检测识别与测距任务,验证了本方法的可行性。