基于CBAM-ResNet50模型的水果图像识别
Fruit Image Recognition Based on CBAM-ResNet50 Model作者机构:甘肃农业大学信息科学技术学院甘肃 兰州
出 版 物:《软件工程与应用》 (Software Engineering and Applications)
年 卷 期:2024年第13卷第1期
页 面:61-72页
学科分类:08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:ResNet50网络 混合注意力机制 迁移学习 数据增广 水果图像识别
摘 要:针对传统水果分类识别精度低,人工成本高等问题,提出一种基于CBAM-ResNet50模型的水果图像识别算法。首先,采用迁移学习技术,将ImageNet数据集上训练好的权重参数迁移到ResNet50网络水果图像分类模型中,保留卷积层和池化层,去掉分类器,作为主干网络模型;其次,在主干网络模型后添加混合注意力机制模块,根据不同的输入特征分配不同权重,提取有效特征,忽略无关信息。然后,用全局平均池化(GlobalAvgPool2D)替换平均池化,将高维数据转化为低维数据,提高计算效率并简化模型训练过程。最后,添加dropout正则化,随机失活权重参数比例,以确保网络对噪声和异常值的鲁棒性,构建Batch Normalization层对输入数据进行归一化,帮助网络更好地学习数据信息的特征分布,进而提高网络模型性能。把收集到的水果图像按照随机取样的方法划分为80%训练集和20%测试集两部分,采用旋转、平移和裁剪等技术扩充水果图像数据集的多样性和变化性,本文提出CBAM-ResNet50网络模型与MobileNet-v3、VGG16、AlexNet、Xception、ResNet50网络模型的识别效果进行对比,试验结果表明,该模型能够有效识别出几种常见的水果图像,相较于初始网络,识别准确率增加了6个百分点,测试准确率高达99%。为了进一步验证模型性能,分析了基于迁移学习下的数据集扩充与未扩充,添加混合注意力机制对网络模型的影响,由此得出,该研究方法在水果分类识别中具有很好的实践意义。