情感语音合成综述
A survey of emotional speech synthesis作者机构:平安科技(深圳)有限公司广东深圳518063 中国科学技术大学安徽合肥230026
出 版 物:《大数据》 (Big Data Research)
年 卷 期:2024年第10卷第5期
页 面:56-73页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:广东省重点领域研发计划“新一代人工智能”重大专项(No.2021B0101400003)
摘 要:作为语音领域一个重要的研究方向,语音合成致力于将文本转化为语音。随着深度学习技术的快速发展,语音合成的目的早已不仅仅是合成一段“能听懂的音频这么简单,情感的加入往往能使语音变得更加具有表现力。基于此,情感语音合成在语音中加入不同的情感并对情感进行调控,以生成灵活且准确的情感语音。从情感语音合成中的几个关键科学问题出发,分别对近几年来基于情感迁移、情感强度控制和情绪混合的发展进行了总结分析,并介绍了情感语音合成的相关数据集和评价指标,最后对情感语音合成进行了展望。