语音情感识别的特征选择方法研究
作者单位:长沙理工大学
学位级别:硕士
导师姓名:叶吉祥
授予年度:2013年
主 题:F-score算法 分形维 互信息度量准则 特征选择 语音情感识别
摘 要:语音特征的提取、特征的情感分析以及语音情感识别算法的研究是语音情感识别(SER)课题研究中最受关注的两个方面,情感特征选择的问题研究相对前两者而言较少受到关注,这也是由特征选择问题本身就是模式识别课题研究的共性问题而决定的。目前已经有多种特征选择方法被采用来解决语音情感特征选择问题,但是大都没有取得良好的特征降维效果及情感识别效果。本文针对现有的方法不能高效地选择出较好的情感特征参数这一问题,对语音情感特征选择这一问题展开了探索性研究。 文中以Russell所提出的四象限情感分类模式为依据,以生活中较常见的四种情感类型:高兴、生气、悲伤、平静为例,对所提取的88个语音特征进行了情感特征选择的研究。本文主要作了以下三方面的工作: 1、基于德语情感语音库,在前人对语音情感声学特征分析的基础上,对语音信号提取了12阶美尔倒谱系数、基频、短时能量、前三阶共振峰、短时过零率共5个基本特征,而后对它们均提取了均值、最大值、最小值、范围和方差等统计特征,最终组成了88维的特征向量,作为后续研究的原始特征集。 2、分别研究了Filter式的F-score算法及分形维算法在语音情感特征选择中的应用。针对F-score算法不能揭示所选特征间的互相关性的缺点,用分形维的特征选择思想对其进行改进提出了改进的Filter-Fscore特征选择算法。在语音情感识别的实验中取得了较好的语音情感特征选择效果。 3、研究了Wrapper式的F-score算法在语音情感特征选择中的应用。同样针对Wrapper式F-score特征选择算法的缺点,引入了作为度量互信息的皮尔逊相关系数的准则,并采用支持向量机的六折交叉验证平均识别率来评价搜索得到的特征子集的优劣。与Wrapper式的F-score算法的对比实验结果表明,本文所改进的Wrapper-Fscore特征选择算法能对原始特征集进行较大幅度的降维,同时提高了语音情感识别率。与两种典型特征选择算法的对比实验则表明改进的Wrapper-Fscore特征选择算法在解决初始特征集规模较低的特征选择问题时,算法具有较高的执行效率。