基于分离对齐策略的领域自适应方法研究
作者单位:吉林大学
学位级别:硕士
导师姓名:王生生
授予年度:2024年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:无监督领域自适应 多源域领域自适应 可迁移特征过滤网络 两阶段训练 分离对齐策略
摘 要:近年来,随着人工智能走进人们的日常生活,深度学习技术逐渐受到广泛关注。在图像无监督领域自适应方向,与传统方法相比,基于深度学习构造的模型能够输出更精准的预测标签。因此,使用深度学习技术建模,来预测目标域样本的标签逐渐成为备受关注的研究领域。 传统的无监督领域自适应方法基于单源域的设置,即仅考虑从单个源域获取知识来预测目标样本的标签。与之相比,多源域领域自适应(MSDA)更适用于实际场景,但由于迁移到目标域的知识来自多个源域,因此更具挑战性。现有的基于对抗的领域自适应方法通过欺骗鉴别器来实现域分布的混淆和特征的跨域对齐。然而,传统的对抗方法忽略了不同特征之间可迁移性的区别,导致一些不可迁移的特征也被强制参与了域对齐训练过程,例如从背景中提取的特征,也被迫在域之间对齐。 为此,本文提出了一种特征过滤机制,并设计了相应的神经网络,实现了基于特征可迁移性的选择性特征对齐,该网络被称为可迁移特征过滤网络(TFFN)。为了让过滤网络发挥作用,本文构建了一个可迁移特征学习框架,该框架包含两个子过程:过滤分离和修补对齐。通过分离对齐两阶段的训练策略,过滤网络可以精准过滤掉弱可迁移特征,保留强可迁移特征,从而在训练对齐时更有针对性,这使得域适应过程更加精准。 本文的主要工作如下: (1)针对传统基于对抗的域适应方法会忽略特征的可迁移性来进行对齐的情况,本文提出了基于分离对齐策略的领域自适应方法,本方法设计了一个可迁移特征过滤网络,能够保留特征向量中的强可迁移特征,过滤掉其中的弱可迁移特征,从而进行特征的选择性对齐。 (2)为了驱动可迁移特征过滤网络履行职能,本文设计了基于过滤分离和修补对齐的两阶段训练过程,在过滤分离阶段,通过训练特征提取器和域鉴别器来依据过滤网络的权重促进域特征混淆;在修补对齐阶段,通过训练过滤网络,来对高可迁移特征赋予高权重,对弱可迁移特征赋予低权重。 (3)为了缓解过拟合问题和提高模型的泛化性能,在训练过滤网络时本文充分考虑目标域样本的参与,因此通过蒸馏学习机制,设计了一个和源分类器起同样作用的目标分类器,用于学习源分类器和目标域知识来识别目标样本。过滤网络的训练同时基于这两个域的分类器,从而避免了其过于依赖源域,从而忽略掉一些目标域的强可迁移特征。 (4)为了验证本文模型的有效性和本文方法的可行性,本文在业界常用的经典公开数据集上对提出的模型进行了充分的实验验证。通过与现有经典方法的实验数据进行对比,验证了模型具有出色的精准度,在一些较难的训练任务上也取得了不错的效果。同时本文还开展了大量的对比、消融实验,结果数据验证了模型各个结构、各个步骤对于最终的预测精准度都有不同程度的贡献,有效验证了提出方法的可行性和合理性。