波达方向初始化空间混合概率模型的语音增强
Direction-guided speech enhancement method of the spatial mixture model作者机构:南京大学声学研究所南京210093 中国科学院声学研究所语言声学与内容理解重点实验室北京100190 中国科学院大学北京100049
出 版 物:《声学学报》 (Acta Acustica)
年 卷 期:2022年第47卷第1期
页 面:139-150页
核心收录:
基 金:中国科学院战略性先导科技专项项目(XDC08010300) 国家自然科学基金项目(11774380,62071461)资助。
主 题:期望最大化算法 混合概率模型 通道数据 波达方向 初始化 语音增强 协方差矩阵 语音识别系统
摘 要:提出了波达方向初始化空间混合概率模型的语音增强算法。通过声源定位估计出声源波达方向,再根据此计算相对传递函数,进而构造空间协方差矩阵来初始化空间混合概率模型。论证了相对传递函数在作为模型参数中语音协方差矩阵的主特征向量时,空间混合概率模型对应的概率分布可达到最大值,进而使期望最大化算法在迭代时更易收敛,以得到期望的掩蔽值。实验先后在自建仿真数据集和CHiME-4的两通道数据集中进行验证,结果表明,将波达方向信息引入到语音增强后语音识别系统的词错误率可以比未引入波达方向的词错误率最多降低3.79%,信号失真比最多提升2.00 dB,验证了在结合波达方向后的空间混合概率模型进行语音增强时性能有所提升。