基于空间注意力和可变形卷积的无人机田间障碍物检测
UAV Field Obstacle Detection Based on Spatial Attention and Deformable Convolution作者机构:浙江理工大学机械工程学院杭州310018 浙江省种植装备技术重点实验室杭州310018 龙泉市菇源自动化设备有限公司龙泉323700 中国科学院深圳先进技术研究院深圳518055 广东省机器人与智能系统重点实验室深圳518055
出 版 物:《农业机械学报》 (Transactions of the Chinese Society for Agricultural Machinery)
年 卷 期:2023年第54卷第2期
页 面:275-283页
核心收录:
学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 13[艺术学] 081104[工学-模式识别与智能系统] 08[工学] 0804[工学-仪器科学与技术] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程]
基 金:国家自然科学基金项目(32001424、31971798) 深圳市科技计划项目(JCYJ20210324102401005) 国家重点研发计划项目(2022YFD2202103) 浙江省“领雁”研发攻关计划项目(2022C02057) 浙江省“三农九方”科技协作计划项目(2022SNJF017)
主 题:田间障碍物 Mask R-CNN 空间注意力 可变形卷积
摘 要:为了解决植保无人机作业时,传统田间障碍物识别方法依赖人工提取特征,计算耗时较长,难以实现在非结构化田间环境下实时作业识别的问题,提出一种优化的Mask R-CNN模型的非结构化农田障碍物实例分割方法。以ResNet-50残差网络为基础,将空间注意力(Spatial attention,SA)引入残差结构,聚焦跟踪目标的显著性表观特征并主动抑制噪声等无用特征的影响;引入可变形卷积(Deformable convolution,DCN),通过加入偏移量,增大感受野,提高模型的鲁棒性。构建包含农田典型障碍物的数据集,通过对比试验研究在ResNet残差网络结构中的不同阶段中加入空间注意力和可变形卷积时的模型性能差异。结果表明,与Mask R-CNN原型网络相比,在ResNet的阶段2、阶段3、阶段5加入空间注意力和可变形卷积后,改进Mask R-CNN的边界框(Bbox)和掩膜(Mask)的平均精度均值(mAP)分别从64.5%、56.9%提高到71.3%、62.3%。本文提出的改进Mask R-CNN可以很好地实现农田障碍物检测,可为植保无人机在非结构化农田环境下安全高效工作提供技术支撑。