咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >情感语音合成综述 收藏

情感语音合成综述

A survey of emotional speech synthesis

作     者:施昊翔 张旭龙 王健宗 程宁 肖京 SHI Haoxiang;ZHANG Xulong;WANG Jianzong;CHENG Ning;XIAO Jing

作者机构:平安科技(深圳)有限公司广东深圳518063 中国科学技术大学安徽合肥230026 

出 版 物:《大数据》 (Big Data Research)

年 卷 期:2024年第10卷第5期

页      面:56-73页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:广东省重点领域研发计划“新一代人工智能”重大专项(No.2021B0101400003) 

主  题:情感语音合成 情感迁移 情感强度 深度学习 

摘      要:作为语音领域一个重要的研究方向,语音合成致力于将文本转化为语音。随着深度学习技术的快速发展,语音合成的目的早已不仅仅是合成一段“能听懂的音频这么简单,情感的加入往往能使语音变得更加具有表现力。基于此,情感语音合成在语音中加入不同的情感并对情感进行调控,以生成灵活且准确的情感语音。从情感语音合成中的几个关键科学问题出发,分别对近几年来基于情感迁移、情感强度控制和情绪混合的发展进行了总结分析,并介绍了情感语音合成的相关数据集和评价指标,最后对情感语音合成进行了展望。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分