基于关键区域检测的细粒度图像识别方法研究
作者单位:华侨大学
学位级别:硕士
导师姓名:杜吉祥
授予年度:2019年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
主 题:深度学习 注意力机制 循环特征融合 多尺度特征 显著性检测
摘 要:人类通过视觉获得大量的图像信息和对外界的认识,如何准确的将所感兴趣的目标对象识别出对应的种类是计算机视觉领域近几年来关注的研究热点,所以利用机器学习或深度学习实现精细化图像的识别显得尤为重要。本文针对细粒度图像识别问题,对当前国内外相关研究进展进行了总结,深入开展了利用深度学习技术进行图像特征提取的研究。本文的工作内容主要包括:(1)基于注意力机制与多尺度的细粒度图像识别方法细粒度图像分类方法需要实现在一个大类别中子类别的准确识别,即实现精细化的图像分类。而在整张图像中,目标对象往往并不会占据图像的整个区域,会受到复杂多样的、以及无效的背景噪音的影响。在深度神经网络中,网络高层的特征损失了很多局部信息,导致部分特征缺损。对此,本文引入注意力模块筛除背景信息,生成特征掩码映射出目标对象的关键区域,并利用Inception模块针对目标对象的多个、不确定关键区域采用不同尺寸卷积进行特征提取,使得到的特征能够同时含有多个尺度的局部细节信息。实验结果表明,相较于目前主流方法,这种基于注意力机制与多尺度的细粒度图像识别方法能够获得更好的识别准确率。(2)循环特征融合训练与显著性检测的细粒度图像识别方法在基于图像金字塔纵向特征融合做预测的研究中,往往只注重最后的预测结果,而忽略了训练过程中横向的循环特征融合再训练能够获得具有更强表达能力。因此,如何在训练过程中提高特征表达能力逐渐成为一个研究热点。对此,本文提出一种基于前向网络的横向循环特征融合再训练的方法。在前向传播中,将高层的输出特征循环输入多个低层结构中进行特征融合训练,有利于实现精细化的特征分类,从而提高细粒度图像的识别准确率。实验结果表明,该方法能够有效提高识别精度。