使用多级静音检测的G.729改进算法
作者单位:四川大学
学位级别:硕士
导师姓名:李珊君
授予年度:2006年
学科分类:080802[工学-电力系统及其自动化] 0808[工学-电气工程] 08[工学]
主 题:G.729/G.729B 语音压缩编码 静音检测技术 多级检测
摘 要:话音通信是现代通信的一个重要方式,随着因特网的发展,VoIP等话音通信新技术的应用变得相当普遍,但是在带宽成为紧缺资源的今天,低速率语音编码技术成为话音通信中的一个关键问题。如何使用尽可能少的编码率来实现尽可能好的话音质量成为语音压缩编码研究的主要目标之一。 ITU-T 1996年发布的语音压缩编码标准G729,即8kb/s码率的共轭结构代数码激励线性预测(CS-ACELP)算法,是符合VoIP技术要求的语音编码算法之一。该算法压缩效率高,合成话音质量好,但是算法本身较为复杂,没有充分利用话音通信中话音片断不连续的特性对话音通信中的静音部分进行压缩以提高信道利用率;而且G. 729算法只能采用固定码率,不能根据网络实际情况进行调节。其后颁布的G. 729B算法虽然利用了话音片断不连续的特性,但是G. 729B的静音检测算法采用4种特征参数,计算过程过于复杂,而且在低信噪比环境下无法有效工作。 本文针对G. 729没有利用谈话中间隙的特点,提出了一种基于M&Z/A的二级静音检测算法对语音进行压缩。该算法第一级采用短时平均幅度差函数进行检测;在短时平均过零率可以有效检测的时候,第二级采用短时平均过零率进行检测,整个算法只有加减运算,简单易行;如果混合语音的短时平均过零率接近噪声的过零率,则第二级检测采用短时自相关函数算法以提高二级检测算法的正确率。在实验室条件下通过各种背景噪声环境下的仿真测试结果说明基于M&Z/A的二级检测算法在低信噪比环境下依然可以有效工作,静音检测性能比G. 729B更加稳定可靠,所以运用二级静音检测算法可以在不增加算法复杂