利用谐波显著度和语者音色特征的混合语音中目标人基频轨迹提取
Target pitch trajectory extraction in hybrid speech by using harmonic saliency and speaker’s timbre features作者机构:山东大学山东威海264209 中国科学院声学研究所北京100190
出 版 物:《声学技术》 (Technical Acoustics)
年 卷 期:2019年第38卷第4期
页 面:408-413页
学科分类:0501[文学-中国语言文学] 050103[文学-汉语言文字学] 05[文学]
基 金:上海市信息安全综合管理重点实验室开放基金项目(AGK201709) 山东省自然科学基金资助项目(ZR2016FM44)
摘 要:从混合语音中提取出目标语者的基频轨迹,是语音监听、语音门禁、对话管理等应用的关键技术。为提高基频轨迹跟踪的准确率、增强抗八度误差的能力、降低系统复杂度,多基频估计以谐波乘积谱为核心,八度校正与基频分组均以元音段为基本单元,并结合了谐波显著度和语者音色特征。基于MIREX2005语音数据集的实验表明,MIREX的4种多基频估计性能指标均在75%以上,基频分组在混合语音中的判断准确率可达92%。