咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >自监督学习在图像聚类中的应用 收藏
自监督学习在图像聚类中的应用

自监督学习在图像聚类中的应用

作     者:孙朗 

作者单位:河北大学 

学位级别:硕士

导师姓名:陈俊芬

授予年度:2023年

学科分类:08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0811[工学-控制科学与工程] 

主      题:图像聚类 卷积神经网络 自监督学习 无监督学习 对比学习 

摘      要:在大型图像数据集的分类任务中,图像标签对于训练至关重要。但是,人工标记图像将花费大量资源。因此探索在没有注释的情况下对图像有效地进行分类的方法是必要的。聚类作为一种无监督学习方法,在无监督图像分类领域取得了一些有希望的结果。但是,传统的聚类方法主要用于具有固定特征的线性模型,因此其性能过度依赖于初始化特征并且很容易产生退化解决方案。在计算机视觉领域,卷积神经网络目前已成为一个重要的组成部分,其权值共享以及稀疏连接的特性使得网络参数总量减少,具有正则化的效果,提高了网络结构的稳定性和泛化能力,避免过拟合,因此通常被用于提取图像深层特征。如今,基于深度卷积神经网络的深度聚类算法逐渐成为主流,伴随着卷积神经网络的深度革命(如Res Net已经达到了一千层以上的深度),网络的特征提取能力已不再是聚类任务的瓶颈,如何将提取到的特征进一步划分为语义相同的簇是目前需要解决的问题。本文致力于将最新的自监督学习方法应用于深度图像聚类,改善现有聚类算法的一些不足,从网络结构、训练方式、损失函数的设计等方面着手提升聚类性能。主要的研究创新点概括如下:(1)提出了一种基于局部语义信息和原型的深度聚类算法(LSPC),该算法旨在学习一组代表性的原型。在训练框架上,将自监督学习中的对比学习算法与基于质心的传统k-means聚类算法相结合。为了使模型能够准确捕获图像中的语义信息,在嵌入空间中挖掘训练样本的相似样本作为局部语义信息,以有效增大属于同一集群的样本之间的相似度。实验结果表明,LSPC算法在多个公共数据集上实现了最先进的性能并且这种优越的聚类性能也可以扩展到如Image Net的大型数据集。(2)考虑到不同类簇上不同的学习状态和学习难度,在第一个工作LSPC的基础上提出了自适应对比聚类算法(Ad CC)。这是一种自适应学习方法,可以根据模型的学习状态进行动态伪标记。实验结果表明,Ad CC算法在常用的公共数据集上实现了最先进的性能。(3)秉持着表示学习和聚类任务相互促进的观点,对于自监督学习下的表示学习给聚类任务带来的性能提升以及聚类任务作为一种辅助任务对无监督视觉特征质量的提升做了大量的对比实验、消融实验以及可视化实验来佐证此观点。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分