基于生成对抗网络的树种识别方法
Tree Species Identification Method Based on Generative Adversarial Network作者机构:黑龙江八一农垦大学信息工程学院大庆163319 山东华宇工学院信息工程学院德州253034
出 版 物:《林业科学》 (Scientia Silvae Sinicae)
年 卷 期:2024年第60卷第2期
页 面:97-105页
核心收录:
学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 13[艺术学] 081104[工学-模式识别与智能系统] 08[工学] 0804[工学-仪器科学与技术] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程]
基 金:国家自然科学基金项目(31170518) 黑龙江省科技攻关项目(GC01KC156) 黑龙江省教育规划课题(GJC1319071)
摘 要:【目的】利用卷积神经网络模型进行图像自动识别时,为防止模型过拟合通常需要大量训练样本。本研究为提高树种识别准确率,在原有叶片图像基础上进行图像样本扩充来保证训练质量,提出一种融合生成对抗网络与卷积神经网络的树种识别方法。【方法】在Pytorch框架下,采集10种常见树种(山杨、梣叶槭、榆、刺槐、紫丁香、杜仲、火炬树、山荆子、水曲柳、红端木)叶片图像作为研究对象。首先,采用均值滤波去噪和尺寸归一化对图像进行预处理。其次,以生成对抗网络生成的图像扩充数据集,其中,以深度卷积生成对抗网络(DCGAN)模型为基础并对其进行改进,建立残差条件深度卷积生成对抗网络(RC-DCGAN)模型,将随机噪声和类别标签作为生成器的输入,以控制样本生成过程;在生成器中嵌入残差结构,使生成模型学习更多特征信息,以提高生成图像质量。然后,将原始图像和扩充图像作为卷积神经网络(CNN)的训练集,一方面,使用RC-DCGAN模型和旋转、镜像、改变对比度等传统图像扩充方法,扩充图像11400幅;另一方面,将原始图像与生成图像、原始图像与传统扩充图像,分别输入至CNN中进行训练,并在原始图像的每个类别中随机挑选50幅对模型进行测试,以验证生成对抗网络对提升识别准确率的可行性。最后,确定适合试验要求的CNN分类模型,并与AlexNet模型、VGG-16模型、VGG-19模型、ResNet18模型的识别效果进行对比,以检验本研究方法的可行性。【结果】RC-DCGAN模型比DCGAN模型生成的图像质量更高,贴合真实图像;利用生成对抗网络扩充图像的方法与ResNet30树种识别模型,训练准确率为99.03%,平均验证识别准确率为97.20%;而在相同树种识别模型下,传统图像扩充方法的识别率为95.50%;在相同数据集下,AlexNet模型、VGG-16模型、VGG-19模型、ResNet18模型所获得的识别率分别为86.52%、87.57%、91.43%、93.25%,均低于本研究模型的识别率。【结论】联合生成对抗网络和卷积神经网络的方法对本研究10种树种叶片图像的识别准确率最高,且克服了使用传统图像处理扩充方法使模型泛化能力下降的问题,说明利用生成对抗网络对图像扩充的方法具有可行性和有效性,可为相关研究工作提供借鉴。