基于卷积神经网络的图像识别技术研究
作者单位:苏州大学
学位级别:硕士
导师姓名:张召
授予年度:2020年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:卷积神经网络 图像识别 鲁棒特征学习 局部与全局特征 计算效率
摘 要:卷积神经网络(CNNs)因其强大的表示学习能力,在图像识别等领域引起了广泛的关注。对于图像识别,现有研究通过构建通用的神经网络或针对具体的问题构造专用的网络来提高相关任务的性能和效率,但是现有的深度模型仍存在如下不足:1)通常需要大量的训练数据进行深度学习;在只有少量训练数据且包含噪声的情况下,模型的鲁棒性和识别性能会变差;2)传统的CNNs基于标准的卷积操作和相关卷积模块进行表示学习,但由于传统卷积的计算效率低会导致相关模块甚至整体网络的计算效率低。此外,传统的池化(pooling)操作是不可学习的,可能会丢失重要的特征信息;3)忽视了分层特征的使用或只关注了局部特征,对全局特征信息的学习不够充分,对网络各层信息的融合能力比较欠缺。针对以上问题,本文主要提出三种创新性的解决策略,并通过图像数据集验证新模型的有效性。本文工作主要包括:(1)为了提升训练数据较少情况下的深度特征学习能力,以及深度卷积网络的鲁棒性和识别性能不足的问题,提出基于低秩稀疏化卷积特征的表示学习算法。对经典的CNNs提取的深度特征进行进一步优化,充分挖掘原始卷积深度特征的低秩稀疏特征并进行去噪,同时在优化过程中保持特征间的局部信息,有效增强了特征学习能力,强化了传统CNNs在使用少量训练数据且携带噪音情况下的图像识别能力。(2)为了强化CNNs对不同层次特征的学习和利用,同时解决传统的pooling导致的不可学习和特征易丢失的问题,提出一种端到端的全卷积密集特征流网络。通过构造一个新的特征提取模块intensive block,显著增强了卷积特征在局部和全局范围内的流动性和耦合性,在一定程度上强化了对局部和全局特征的利用。另外,为了缓解传统卷积计算效率低的问题,引入了深度分离卷积,提升了全卷积网络的效率。(3)为了增强DenseNet中密集块(dense block)的计算效率,提出快速密集块(FDB)的思想,并将FDB的思想引入残差密集网络(RDN)中的残差密集块(RDB),构造出快速的残差密集块(f-RDB),在保留RDB局部特征学习能力的同时减小了计算量,有效提高了特征学习效率。为了增强卷积网络的全局学习能力,进一步提出了一种端到端的快速密集残差网络。在f-RDB的基础上,构造能够充分利用并学习全局特征信息的全局密集块(GDB),增强了全局特征的融合能力。并在模块GDB后增加了下采样模块,逐步提高用于下采样的卷积的通道数,在减小特征尺寸的同时提取出信息量更丰富的深度特征。提出的模型充分学习利用了局部和整体的特征信息,增强了卷积网络的识别分类性能。通过大量的实验验证了提出的新方法的有效性。