基于可信样本聚类的无监督行人重识别方法研究
作者单位:南昌大学
学位级别:硕士
导师姓名:韩清;闵卫东
授予年度:2024年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:行人重识别 无监督学习 关联规则挖掘 标签优化 平均教师模型
摘 要:随着人工智能技术和大数据时代的发展,行人重识别技术在视频监控和智能交通等领域得到广泛应用。然而,传统的有监督行人重识别方法需要大量的人力和物力投入,因此,无监督行人重识别备受关注。现有无监督行人重识别方法中存在两个问题:其一、在基于聚类微调的无监督行人重识别任务中,由于聚类算法本身存在不确定性,其生成的类别标签缺乏可靠性,导致模型无法准确学习行人之间的相似性关系。其二、平均教师模型常被应用于半监督任务,由于该模型对数据中的异常值和噪声比较敏感,将其迁移到无监督任务,会导致训练过程中产生大量的噪声,从而严重阻碍了模型的表征能力。 (1)针对问题一,本文提出了基于数据增补和自引导预训练的无监督行人重识别框架。首先,为了提高聚类类别的可靠性,本文设计了自引导预训练策略,该策略利用关联规则算法,挖掘整个训练周期聚类产生的所有类别信息,提取高相似度样本类别指导模型预训练。考虑到关联规则算法计算复杂度较高的问题,本文还设计了一个相似度距离矩阵,将关联规则挖掘任务简化为探索成对图像相似度任务,从而降低计算复杂度,再结合聚类算法获取高相似度类别。其次,为了提高标签的可靠性,本文提出一种新的标签优化方案,该方案先通过提取多增广视图的特征信息,对源视图特征信息进行补充得到了聚合特征,为此本文还利用该聚合特征设计了一个可靠性评价分数,该分数用于量化源特征与所有类质心的可靠性关系,然后基于该分数优化样本标签,提高了标签的鲁棒性。最后,在三个公开数据集上进行了大量实验,实验结果证明了本文的方法优于现有方法。 (2)针对问题二,本文提出了一种基于平均教师模型和部件特征对齐的无监督行人重识别方法。首先,为了稳定模型训练,本文在无监督行人重识别任务中引入了平均教师模型,这有助于提高模型的收敛速度。考虑到教师网络未能产生对学生网络的有效监督信号,本文提出了非对称一致性模块,该模块提高了学生网络对教师网络特征信息的预测难度,从而避免了学生网络陷入局部最优解。其次,为了降低模型训练的噪声问题,本文基于行人结构的先验知识,设计了部件特征对齐模块,该模块通过对特征图进行手工切分,然后利用交叉熵损失函数实现行人局部特征对齐,这有助于提高模型对行人的细粒度信息的分类能力,促进模型训练前期快速收敛,有效改善了噪声影响。最后,在两个公开数据集上进行了大量实验,本文的方法有效提高了模型的表征能力,其实验结果表明了本文的方法领先于现有工作。