基于BP神经网络的语音增强系统研究
作者单位:河南大学
学位级别:硕士
导师姓名:赵建军
授予年度:2006年
摘 要:语音是人类相互之间进行交流最自然和最方便的形式之一。语音通信是一种理想的人机通信方式。目前各种语音数字信号处理技术如语音编码、语音识别等已广泛应用于各个信号处理领域中,但是在复杂的语音环境下、特别当干扰噪声信号具有与原始语音信号相类似的语音特征时,各种语音数字信号处理算法的性能会显著下降。这里就需要引入在语音数字信号处理实用化过程中一项关键技术研究:语音增强和噪声分离,即如何在复杂背景语音环境下,从观测输入混合语音信号中,分离估计出所需要的干净原始语音信号。 第一,背景噪声破坏了语音信号原有的声学特征和模型参数,降低语音通信质量。在日益要求提高语音通信质量需求下,随着数字信号处理技术的飞速发展,芯片价格的下降,使研究以新硬件新算法为基础的新的语音增强方法有着重要价值。 第二,本文主要讨论了基于神经网络的语音增强方法。首先介绍了语音信号和神经网络的基本理论,然后提出了基于BP神经网络的语音增强系统的建模方法。综合语音特征提取,归纳出了语音倒谱和噪声倒谱估值用于神经网络训练和学习并最终消除噪声。仿真结果表明,该噪声抵消器的设计方法,不仅实现简单,而且节省运行时间,语音增强效果很好。 第三,本文利用神经网络进行语音增强,在无噪和含噪条件下,提取语音信号的mel倒谱系数,并对噪声在倒谱域进行估计。用于BP神经网络的训练和学习,利用神经网络系统具有非线性映射和自学习,能够用于噪声信号的非线性建模的能力,获取信号的最佳估计,克服信号处理中存在的不确定性,最终达到语音信号消噪和提高可懂度的目的。