基于改进YOLO v5s的轻量化植物识别模型研究
Lightweight Plant Recognition Model Based on Improved YOLO v5s作者机构:北方民族大学电气信息工程学院银川750021 宁夏农林科学院植物保护研究所银川750002 宁夏回族自治区草原工作站银川750002 西南大学计算机与信息科学学院重庆400715
出 版 物:《农业机械学报》 (Transactions of the Chinese Society for Agricultural Machinery)
年 卷 期:2023年第54卷第8期
页 面:267-276页
核心收录:
基 金:宁夏农业高质量发展和生态保护科技创新项目(NGSB-2021-14-05) 国家自然科学基金面上项目(61976107) 北方民族大学重点研究项目(2021JY005、YCX22134)
主 题:植物识别 YOLO v5s BoTNet 坐标注意力 深度可分离卷积 轻量化
摘 要:为方便调查宁夏全区荒漠草原植物种类及其分布,需对植物识别方法进行研究。针对YOLO v5s模型参数量大,对复杂背景下的植物不易识别等问题,提出一种复杂背景下植物目标识别轻量化模型YOLO v5s-CBD。改进模型YOLO v5s-CBD在特征提取网络中引入带有Transformer模块的主干网络BoTNet(Bottleneck transformer network),使卷积和自注意力相结合,提高模型的感受野;同时在特征提取网络融入坐标注意力(Coordinate attention,CA),有效捕获通道和位置的关系,提高模型的特征提取能力;引入SIoU函数计算回归损失,解决预测框与真实框不匹配问题;使用深度可分离卷积(Depthwise separable convolution,DSC)减小模型内存占用量。实验结果表明,YOLO v5s-CBD模型在单块Nvidia GTX A5000 GPU单幅图像推理时间仅为8 ms,模型内存占用量为8.9 MB,精确率P为95.1%,召回率R为92.9%,综合评价指标F1值为94.0%,平均精度均值(mAP)为95.7%,在VOC数据集平均精度均值可达80.09%。相比YOLO v3-tiny、YOLO v4-tiny和YOLO v5s,改进模型内存占用量减小,平均精度均值提升。模型YOLO v5s-CBD在公开数据集和宁夏荒漠草原植物数据集都有良好的鲁棒性,推理速度更快,且易于部署,已应用在宁夏荒漠草原移动端植物图像识别APP和定点生态信息观测平台,可用来调查宁夏全区荒漠草原植物种类和分布,长期观测和跟踪宁夏盐池县大水坑、黄记场、麻黄山等地植物生态信息。