基于协同训练和主动学习的半监督图像分类研究
作者单位:华中科技大学
学位级别:硕士
导师姓名:吴海
授予年度:2020年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
主 题:图像分类 支持向量机 主动学习 标签传播 阶梯网络 协同训练
摘 要:随着“大数据时代的到来,数据的量级不断增加,数据的类型也不再拘泥于传统的文字,以图像为代表的多媒体数据占据着极大的比重,如何从这些庞大的多媒体数据中提取出有效可用的信息是当前一个广泛研究的问题。自上世纪70年代开始,图像检索领域就逐渐引起人们的重视,但是大多数数据只是单纯的数据,需要人工对图像进行标记分类,耗费很大的人力物力,很大程度上限制了图像检索技术的发展。为了改善这种困境,图像自动分类技术引起了广泛的关注。支持向量机(SVM)算法和深度学习算法被广泛地应用在图像自动分类技术中,都取得了较好的研究进展。但是这两种方法都存在一个问题:小样本问题,即在有标签样本规模较小的情况下,算法的分类性能十分有限。为了解决小样本问题,本文考虑使用半监督学习方法进行图像分类研究,提出了一种基于主动学习和协同训练的半监督图像分类算法。本文首先提出一种基于标签传播和主动学习的半监督图像分类模型,这个模型以SVM为基分类器,利用SVM的输出结果选择合适的样本,通过标签传播进行标签预测后加入主动学习过程中,从而优化SVM的分类性能。然后,本文提出基于卷积神经网络的半监督阶梯网络模型,将卷积神经网络引入阶梯网络,从而更好地提取图像特征,加快模型训练,优化分类效果。最后,利用协同训练思想,将上述训练好的两个模型利用加权融合策略选择合适的样本进行协同训练,进一步提高分类器的分类性能。实验表明,在有标签样本数量较小的情况下,分类器可以有效利用无标签样本的信息,相比现有的一些半监督分类方法有着更好的分类性能。