咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于F-DFCC融合特征的语音情感识别方法 收藏

基于F-DFCC融合特征的语音情感识别方法

Speech emotion recognition based on F-DFCC fusion feature

作     者:何朝霞 朱嵘涛 罗辉 HE Zhaoxia;ZHU Rongtao;LUO Hui

作者机构:长江大学文理学院湖北荆州434023 东北林业大学计算机与控制工程学院黑龙江哈尔滨150040 

出 版 物:《现代电子技术》 (Modern Electronics Technique)

年 卷 期:2024年第47卷第6期

页      面:131-136页

学科分类:0711[理学-系统科学] 07[理学] 

基  金:国家自然科学基金青年科学基金项目(62101114) 湖北省教育厅科学研究计划指导性项目(B2022474) 荆州市科技局、长江大学文理学院联合基金项目(2023LHX04) 

主  题:语音情感识别 DFCC F-DFCC 融合特征 特征提取 Fisher比 ECAPA-TDNN 

摘      要:结合神经网络、并行多特征向量和注意力机制,有助于提高语音情感识别的性能。基于此,从前期已经提取的DFCC参数入手,提取I-DFCC和Mid-DFCC特征参数,利用Fisher比选取特征参数构成F-DFCC;再将F-DFCC特征参数与LPCC、MFCC特征参数进行对比并融合,输入到含双向LSTM网络及注意力机制的ECAPA-TDNN模型中;最后,在CASIA和RAVDESS数据集上验证F-DFCC融合特征参数的有效性。实验结果表明:与单一的F-DFCC特征参数相比,F-DFCC融合特征的准确率WA、召回率UA、F1-score在CASIA数据集上分别提高0.035 1、0.031 1、0.031 3;在RAVDESS数据集上分别提高0.024 5、0.035 8、0.033 2。在两个数据集中,surprised情感的识别准确率最高,为0.94;F-DFCC融合特征参数的6种和8种情感识别率与其他特征参数相比均有所提升。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分