基于深度表示学习的小样本图像分类的研究
作者单位:中国科学技术大学
学位级别:硕士
导师姓名:陈欢欢
授予年度:2021年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:小样本学习 图像分类 互信息 深度学习 神经网络 表示学习
摘 要:近年来,随着互联网技术的普及和快速发展,人们能够通过网络获取大量的标注数据,大数据和人工智能技术也因此在很多领域得到了质的飞跃,如图像识别,语音识别等。然而目前的主流的图像识别和分类算法都是基于深度神经网络架构,都依赖于大量的标注数据,在面临数据匮乏的场景时,往往不能有预期的表现。因此基于小数据集的研究,即少样本学习,也显得十分重要。为了解决这一问题,本文以图像分类任务为载体,研究了半监督小样本特征表示学习,包括基于对抗自编码器以及最大化互信息的两种神经网络架构。本文首先提出了基于对抗自编码器的网络架构来学习特征提取的算法。该算法通过编码器获取图片样本的特征信息,并使用高维向量表示,之后通过解码器来还原样本,以此学习每个样本的隐空间特征表示。与此同时,通过引入对抗训练的方式,既能起到数据增强的作用,还能提高模型判别性特征的学习能力。最后通过基于距离的度量学习方法,为每个测试样本计算出最为相似的标注样本,以此完成分类任务。鉴于变分自编码器在数据量极小的情况下存在着过拟合的风险,因此本文进一步提出基于转导学习和互信息最大化的算法来学习样本的特征表示。该算法首先通过卷积神经网络来提取所有图片的局部特征和全局特征,使用无监督模式训练模型,最大化来自样本的全局特征与局部特征的互信息。同时引入聚类损失函数来聚合相同类别的样本特征。最后利用基于距离度量的方法来计算样本间的相似度,并将每个未标注的样本归为最为相似的标注样本一类。本文所述方法的主要贡献包括:(1)基于对抗自编码器网络,利用少量的标注样本,能实现半监督学习的训练,并加强了对每个样本的判别性特征提取和表示能力;(2)利用转导推理方式,最大化所有样本的局部特征图和全局特征向量的互信息,将样本同时映射到具有更加稳定判别边界的特征向量空间;(3)设计和利用增加硬间隔的聚类损失函数,使得模型学习的相同类别样本的特征能够聚集,这能够有效提高基于距离的度量学习方法的分类效果。本文最后在常用的小样本图像分类数据集上对提出的两种算法进行了实验验证,实验结果也证实了本文算法的可行性和有效性。