基于对抗网络的声纹识别域迁移算法
GAN-Based Domain Adaptation Algorithm for Speaker Verification作者机构:华东理工大学信息科学与工程学院上海200237
出 版 物:《华东理工大学学报(自然科学版)》 (Journal of East China University of Science and Technology)
年 卷 期:2022年第48卷第2期
页 面:231-236页
学科分类:0810[工学-信息与通信工程] 0817[工学-化学工程与技术] 081203[工学-计算机应用技术] 08[工学] 0805[工学-材料科学与工程(可授工学、理学学位)] 0703[理学-化学] 0835[工学-软件工程] 0702[理学-物理学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:针对声纹识别任务中常常出现的由于真实场景语音与模型训练语料在内部特征(情感、语言、说话风格、年龄)或外部特征(背景噪声、传输信号、麦克风、室内混响)等方面的差异所导致的模型识别率低的问题,提出了一种基于对抗网络的声纹识别域迁移算法。首先,利用源域语音对X-Vector的声纹识别模型进行训练;然后,采用域迁移方法将源域训练的XVector模型迁移至目标域训练数据;最后,在目标域测试数据上检测迁移后的模型性能,并将其与迁移前的模型性能进行对比。实验中采用AISHELL1作为源域,采用VoxCeleb1和CNCeleb分别作为目标域对算法性能进行测试。实验结果表明,采用本文方法进行迁移后,在VoxCeleb1和CN-Celeb的目标域测试集上的等错误率分别下降了21.46%和19.24%。