基于Teager能量算子(TEO)非线性特征的语音情绪识别
Emotion Recognition of Mandarin Speech Using Nonlinear Features Based on Teager Energy Operator(TEO)作者机构:航天医学工程研究所北京100094 北京理工大学北京100081
出 版 物:《航天医学与医学工程》 (Space Medicine & Medical Engineering)
年 卷 期:2005年第18卷第6期
页 面:427-431页
核心收录:
学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 13[艺术学] 081104[工学-模式识别与智能系统] 08[工学] 0804[工学-仪器科学与技术] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程]
基 金:中国载人航天工程项目资助
主 题:语音 情绪 识别 Teager能量算子
摘 要:目的探索识别汉语语音情绪的有效识别特征。方法采用基于Teager能量算子(TEO)的非线性特征,通过马尔可夫模型法(HMM),从汉语语音中识别平静和生气、欢快、悲伤4种情绪。结果文本有关时,5个非线性特征:基于频域TEO的Mel倒谱系数(nonlinear frequency domain Mel,NFD-Mel)、基于幅频特性的Mel倒谱参数(am plitude and frequency property Mel,AF-Mel)、基于微分幅频特性的Mel倒谱参数(am plitude and frequency property Mel of differential,DAF_Mel)、基于幅度调制的子带倒谱参数(AM-based SBCC,AM_SBCC)及基于幅频调制的子带倒谱参数(AMFM-based SBCC,AMFM-SBCC)的情绪识别性能全部高于Mel频率倒谱参数(Mel-scaled cepstrum coefficients,MF-CC)。文本无关时,NFD-Mel、AF-Mel、DAF-Mel的识别率高于MFCC,AM_SBCC、AM FM-SBCC的情绪识别率低于MFCC。结论结合非线性TEO的识别特征NFD-Mel、AF-Mel、DAF-Mel可有效提高情绪识别性能。