基于多情感说话人自适应的情感语音合成研究
Research on Emotion Speech Synthesis Based on Multi Emotional Speaker Adaptive作者机构:国网安徽省电力有限公司信息通信分公司安徽合肥230000 厦门大学计算机科学学院福建厦门361005 安徽继远软件有限公司安徽合肥230000
出 版 物:《湘潭大学学报(自然科学版)》 (Journal of Xiangtan University(Natural Science Edition))
年 卷 期:2018年第40卷第4期
页 面:39-44页
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:提出了一种基于多情感自适应的情感语音合成方法,其创新点在于,通过SAT过程从多个说话人的情感语音语料中获得情感语音的平均音模型,对目标说话人的情感数据进行自适应变换,构建目标情感的声学参数模型,从而达到合成出目标说话人的情感语音的效果.实验表明,本方提出的方法能够获得自然度和情感相似度均较好的合成情感语音.