采用独立说话人模型的语音转换
Voice conversion based on isolated speaker model作者机构:苏州大学电子信息学院苏州215006
出 版 物:《声学学报》 (Acta Acustica)
年 卷 期:2012年第37卷第3期
页 面:346-352页
核心收录:
基 金:北京市"现代信息科学与网络技术"重点实验室暨铁道部"铁路信息科学与工程"开放实验室基金资助(XDXX1006)
主 题:说话人识别 语音转换 语音模型 Gaussian 高斯混合模型 训练方法 系统扩展性 声学结构
摘 要:提出一种基于完全独立的说话人语音模型进行语音转换的方法。首先每个说话人采用各自的语料训练结构化高斯混合模型(Structured Gaussian Mixture Model,SGMM),然后根据源和目标说话人各自的模型采用全局声学结构(AcousticalUniversal Structure,AUS)进行匹配和高斯分布对准,最终得到相应的转换函数进行语音转换。ABX和MOS实验表明可以得到与传统的平行语料联合训练方法接近的转换性能,并且转换语音的目标说话人识别正确率达到94.5%。实验结果充分说明了本文提出的方法不仅具有较好的转换性能,而且具有较小的训练量和很好的系统扩展性。