基于单目视觉的智能车感知算法研究与应用
作者单位:东南大学
学位级别:硕士
导师姓名:殷国栋
授予年度:2021年
学科分类:082304[工学-载运工具运用工程] 08[工学] 080204[工学-车辆工程] 0802[工学-机械工程] 0823[工学-交通运输工程]
摘 要:人工智能相关技术的研究带动了汽车智能化的发展,近年来我国智能车的市场规模与渗透率持续提升,配备先进传感器的高级驾驶辅助系统在车辆中越来越普及。智能驾驶汽车的发展能够有效地减少目前交通普遍存在的阻塞拥堵、能源消耗和交通事故,对缓解我国日益繁杂的交通环境具有重要意义。作为智能驾驶三大关键技术(感知环境、规划决策、执行控制)之一,感知算法对智能车的重要性不言而喻。在目前主流的两种感知传感器方案中,激光雷达虽然具有高精度远距离探测的优势,但是其成本高昂,市场竞争力较小,不具备量产的前提;而相对的,基于单目摄像头的视觉感知方案则具有识别效率高、市场规模大、量产成本低的特点,已普遍应用于智能车的感知系统中。基于单目视觉的智能车感知算法以道路交通场景下的行人、车辆、交通标识等为识别目标,通过特征提取、分类,继而定位、分割来实现环境的感知。而目前视觉感知算法存在环境适应能力较差(如夜晚、雨雪雾的天气等)、鲁棒性不足、数据集规模较小(特别针对分割算法)、实时性较低等问题。针对上述问题,本文主要研究内容如下:(1)研究基于特征融合机制的目标检测。针对现有目标检测算法在面对复杂天气与光照条件下表现普遍不佳的问题,深入研究目标检测框架的特征机制,提出针对通道与空间维度的注意力机制优化方案;针对对多尺度特征层信息的融合问题设计自适应融合算法,通过网络自学习的参数实现更佳的特征融合算法。使用大规模复杂交通场景数据集BDD100K进行训练,实验证明本文所设计的算法在保证实时性的情况下,有效提高了模型的性能;(2)研究基于全局掩膜编码的实例分割。针对现有智能驾驶的实例掩膜数据集稀缺的问题,设计对应的增广方法,通过随机图像拼接与随机实例剪切的方案实现有效的数据增广,基于KITTI数据集提出了半监督模型生成的伪标签结合手工标记的方案,填补了实例分割数据集的缺陷;在此基础上,针对全局掩膜特征层的掩膜编码输出问题,提出了多尺度池化模块与多扩张率卷积模块的优化算法,实现分割算法的提升;(3)研究感知算法在智能车上的轻量化实时应用与部署。针对现有感知算法对处理器算力需求过高难以满足嵌入式处理器的实时部署问题,设计卷积网络的轻量化模型方案,通过卷积特征复用、卷积空间与通道的分离计算与在通道层面以及阶段层面的分组计算方法,实现网络参数量与计算量的大幅减少;在中、高端嵌入式处理器NVIDIA Jetson TX2以及Jetson Xavier上进行实验,证明本文设计的模型在轻量化的情况下能够实时的部署于嵌入端,并且能够保持一定的准确性。