基于深度学习模型的图像分类方法研究
作者单位:河南大学
学位级别:硕士
导师姓名:胡振涛
授予年度:2018年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:近年来,在互联网技术迅速发展的同时,网络数据量也在急剧增加,数据采集的技术也有极大提高,越来越多的人使用图像来表示和传输信息,为了人们能快速准确地从图像中获取信息,图像分类作为人工智能的一个重要领域被广泛研究。对于图像分类问题,关键在于如何从图像中提取出更加抽象的特征信息,特征提取的好坏对分类结果至关重要。深度学习是近年来出现的一种多层神经网络学习算法,因其优秀的特征学习能力被广泛应用于图像分类、语音识别及自然语言处理等领域。首先,本文在具体分析图像分类以及深度学习理论发展现状的基础上,深入研究了两种经典的深度学习模型:深度置信网络(Deep Belief Network,DBN)和卷积神经网络(Convolutional Neural Network,CNN)。其次,针对传统深度置信网络训练过程中因固定学习参数导致的网络收敛速度慢、分类精度不高的问题,提出了一种基于改进的自适应LBP-DBN图像分类算法。该算法首先将一种自适应更新准则引入到限制玻尔兹曼机的训练中;然后通过计算迭代前后的重构误差增量和权重更新方向来实现动量和学习率的自适应调节;最后分别通过ORL数据库和Yale数据库进行验证,实验结果表明,相比于传统的LBP-DBN算法,本文所提算法能有效提升网络的分类精度,在收敛速度上也有所改善。最后,针对传统卷积神经网络训练时因随机初始化权值以及特征提取过程中的噪声干扰引起的网络分类精度不佳的问题,提出了一种基于权值集成优化的卷积神经网络图像分类算法。该算法首先提取样本的隐层特征映射作为先验信息,利用模拟退火寻得最优解作为全连接层初始化权值,进而加快权值更新和网络收敛;其次在卷积层引入高斯函数,通过高斯卷积运算对图像进行平滑,降低噪声对特征提取的干扰;最后将集成优化后的网络应用于MNIST数据库和CIFAR-10数据库,实验结果表明集成优化后网络的收敛速度和分类准确率得到了提高。