咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于Teager能量算子(TEO)非线性特征的语音情绪识别 收藏

基于Teager能量算子(TEO)非线性特征的语音情绪识别

Emotion Recognition of Mandarin Speech Using Nonlinear Features Based on Teager Energy Operator(TEO)

作     者:高慧 苏广川 陈善广 GAO Hui;SU Guang-chuan;CHEN Shan-guang

作者机构:航天医学工程研究所北京100094 北京理工大学北京100081 

出 版 物:《航天医学与医学工程》 (Space Medicine & Medical Engineering)

年 卷 期:2005年第18卷第6期

页      面:427-431页

核心收录:

学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 13[艺术学] 081104[工学-模式识别与智能系统] 08[工学] 0804[工学-仪器科学与技术] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程] 

基  金:中国载人航天工程项目资助 

主  题:语音 情绪 识别 Teager能量算子 

摘      要:目的探索识别汉语语音情绪的有效识别特征。方法采用基于Teager能量算子(TEO)的非线性特征,通过马尔可夫模型法(HMM),从汉语语音中识别平静和生气、欢快、悲伤4种情绪。结果文本有关时,5个非线性特征:基于频域TEO的Mel倒谱系数(nonlinear frequency domain Mel,NFD-Mel)、基于幅频特性的Mel倒谱参数(am plitude and frequency property Mel,AF-Mel)、基于微分幅频特性的Mel倒谱参数(am plitude and frequency property Mel of differential,DAF_Mel)、基于幅度调制的子带倒谱参数(AM-based SBCC,AM_SBCC)及基于幅频调制的子带倒谱参数(AMFM-based SBCC,AMFM-SBCC)的情绪识别性能全部高于Mel频率倒谱参数(Mel-scaled cepstrum coefficients,MF-CC)。文本无关时,NFD-Mel、AF-Mel、DAF-Mel的识别率高于MFCC,AM_SBCC、AM FM-SBCC的情绪识别率低于MFCC。结论结合非线性TEO的识别特征NFD-Mel、AF-Mel、DAF-Mel可有效提高情绪识别性能。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分