全局特征及弱尺度融合策略的小样本语音情感识别
Small sample size speech emotion recognition based on global features and weak metric learning作者机构:东南大学自动化学院南京210096 上海交通大学图像处理与模式识别研究所上海200240
出 版 物:《声学学报》 (Acta Acustica)
年 卷 期:2012年第37卷第3期
页 面:330-338页
核心收录:
基 金:国家863计划 国家自然科学基金资助项目
主 题:语音情感识别 全局特征 融合策略 小样本 Fisher准则 局部特征 小波包分解 后提取
摘 要:语音是一种短时平稳时频信号,因此大多数的研究者都通过分帧来提取情感特征。然而,分帧后提取的特征为局部特征,无法准确反应情感语音动态特性,故单纯采用局部特征往往无法构建鲁棒的情感识别系统。针对这个问题,先在不分帧的语音信号里通过多尺度最优小波包分解提取语句级全局特征,分帧后再提取384维的语句级局部特征,并利用Fisher准则进行降维,最后提出一种弱尺度融合策略来将这两种语句级特征进行融合,再利用SVM进行情感分类。基于柏林情感库的实验结果表明本文方法较单纯使用语句级局部特征最后识别率提高了4.2%到13.8%,特别在小样本的情况下,语音情感识别率波动较小。