咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于不确定性学习的文本无关的说话人确认方法 收藏

基于不确定性学习的文本无关的说话人确认方法

Text-independent speaker verification method based on uncertainty learning

作     者:张玉莲 姚姗姗 王超 畅江 ZHANG Yulian;YAO Shanshan;WANG Chao;CHANG Jiang

作者机构:山西大学大数据科学与产业研究院太原030006 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2023年第43卷第12期

页      面:3727-3732页

学科分类:0711[理学-系统科学] 07[理学] 08[工学] 0804[工学-仪器科学与技术] 

基  金:国家自然科学基金资助项目(61906115) 山西省青年科学基金资助项目(20210302124556)。 

主  题:说话人确认 数据不确定性 分布嵌入 AAM-softmax KL散度 

摘      要:说话人确认任务旨在判断注册语音与测试语音是否属于同一说话人。针对说话人识别系统提取的声纹特征通常会受到与身份信息无关的因素干扰进而导致系统的准确性严重下降的问题,提出一种基于不确定性学习(UL)的文本无关的说话人确认(TISV)方法。首先,在说话人主干网络中引入不确定性同时学习声纹特征(均值)和话语数据的不确定性(方差),以建模语音数据集中的不确定性;其次,通过重采样技巧得到特征的分布表示;最后,在说话人分类损失中引入KL散度正则化约束噪声的分布,从而解决计算分类损失过程中的退化问题。实验结果表明,当训练集为VoxCeleb1和VoxCeleb2开发集时,与基于确定性方法的Thin ResNet34模型相比,所提方法的模型在VoxCeleb1-O测试集上的等错误率(EER)分别降低了9.9%和10.4%,最小检测代价函数(minDCF)分别降低了10.9%和4.5%。可见,所提方法在有噪声、无约束场景下的准确度有所提高。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分