域泛化问题中基于Mixup与对比损失的特征转换模型(英文)
作者机构:中国科学技术大学管理学院统计与金融系
出 版 物:《中国科学技术大学学报》 (Journal of University of Science and Technology of China)
年 卷 期:2024年第4期
页 面:38-46页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:supported by the National Natural Science Foundation of China (12171451) Anhui Center for Applied Mathematics
摘 要:当表示基础数据分布的域在训练和测试数据集之间存在差异时,传统的深度神经网络的性能会大幅下降。域泛化方法旨在仅使用源域的训练数据来提高在未知目标域上的泛化能力。主流的域泛化算法通常对一些流行的特征提取网络(如Res Net)进行修改,或者在特征提取网络之后添加更复杂的参数模块。流行的特征提取网络通常在大规模数据集上进行了较好的预训练,因此具有较强的特征提取能力,而对其进行修改会削弱这种能力。添加更复杂的参数模块会导致更深的网络,并且对计算资源要求更高。本文基于域泛化中流行的特征提取网络,提出了一种新的特征转换模型,不做任何更改或添加任何模块。通过结合对比损失和数据增强策略(即Mixup),该特征转换模型的泛化能力得到了提升,并提出了一种新的样本选择策略来与Mixup和对比损失相协作。在基准数据集PACS和Domainnet上的实验结果表明,该方法优于传统的域泛化方法。