咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于声纹特征的伪造语音检测 收藏

基于声纹特征的伪造语音检测

Spoof speech detection based on speaker features

作     者:张宇翔 李茁 陆镜泽 尚增强 陈树丽 王文超 张鹏远 ZHANG Yuxiang;LI Zhuo;LU Jingze;SHANG Zengqiang;CHEN Shuli;WANG Wenchao;ZHANG Pengyuan

作者机构:中国科学院语音与智能信息处理实验室(声学研究所)北京100190 中国科学院大学北京100049 

出 版 物:《声学学报》 (Acta Acustica)

年 卷 期:2025年第50卷第1期

页      面:201-210页

核心收录:

学科分类:0301[法学-法学] 03[法学] 

基  金:中国科学院青年创新促进会项目 国家自然科学基金项目(12204509)资助 

主  题:伪造语音检测 声纹识别 鲁棒性 可解释性 

摘      要:目前的伪造语音检测方法在特定数据集上表现良好,但鲁棒性和可解释性较差。伪造语音生成通常通过单一特征实现说话人表示,缺乏对声纹特征的精细控制,导致真伪语音声纹特征分布存在差异。为此提出了一种基于声纹特征的伪造语音检测方法。该方法通过在预训练声纹识别系统基础上训练部分参数,建模真伪语音之间浅层帧级声纹特征的分布差异,实现伪造语音检测。该方法还改善了直接使用声纹特征鉴伪难以应对单元选择合成等音色高度相似的伪造算法的情况。所提方法在ASVspoof 2019 LA测试集中相比训练声纹识别系统全部参数的基线系统等错误率相对降低69.6%,且在跨信道和切除静音等场景中都具有良好的鲁棒性。

读者评论 与其他读者分享你的观点