病态嗓音特征的小波变换提取及识别研究
Research of extracting of pathological voice's characteristics and recognition based on wavelet transformation and Gaussian mixture model作者机构:广西师范大学物理与电子工程学院广西桂林541004 柳州铁道职业技术学院电子工程系广西桂林545007
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2009年第45卷第22期
页 面:194-196,205页
核心收录:
学科分类:0810[工学-信息与通信工程] 08[工学] 081002[工学-信号与信息处理]
主 题:高斯混合模型(GMM) 病态嗓音 Mel倒谱系数(MFCC) 小波变换
摘 要:通过分析嗓音的发音机理、病态嗓音与正常嗓音在频域的表现差异,利用小波变换对信号进行分解,突出病态嗓音的特点,提出了基于多尺度分析的小波降噪、分解的熵系数(Entropy Coefficient based on De-noise,Decomposition of Multi-scale Analysis,ECDDMA)作为识别的特征矢量集。并对比分析了语音识别中经典特征参数Mel倒谱系数(MFCC),分别运用这两种特征参数对242例正常嗓音和234例病态嗓音运用高斯混合模型(GMM)进行了识别。结果显示:ECDDMA系数较传统的模拟人耳听觉非线性特性的MFCC及其动态特征能更准确地表征正常与病态嗓音之间的差异,有利于同时提高病态和正常嗓音的识别率。