咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于LMD改进特征提取的三路病理语音识别 收藏

基于LMD改进特征提取的三路病理语音识别

Three channel pathological speech recognition based on LMD improved feature extraction

作     者:张楠 陈媛媛 陈鑫钰 侯懿桃 Zhang Nan;Chen Yuanyuan;Chen Xinyu;Hou Yitao

作者机构:中北大学信息与通信工程学院太原030024 

出 版 物:《电子测量技术》 (Electronic Measurement Technology)

年 卷 期:2024年第47卷第12期

页      面:140-147页

核心收录:

学科分类:0711[理学-系统科学] 1002[医学-临床医学] 07[理学] 100204[医学-神经病学] 10[医学] 

基  金:山西省基础研究计划项目(202203021221103)资助 

主  题:发音障碍 局部均值分解 病理语音识别 特征提取 

摘      要:针对发音障碍患者发音不够清晰准确,导致病理语音识别率低的问题,提出一种基于LMD改进的Gammatone滤波器组图谱特征提取算法进行三路病理语音识别,首先,该算法采用LMD分解语音信号,对分解后的各语音分量做短时傅里叶变换后进行频率合成,提取滤波器组特征及其一阶、二阶差分特征,构成能获取病理语音有效局部特征的LMD-GFbank图谱特征;其次,为了进一步优化网络模型在训练过程中遗漏掉部分有效特征信息,提出一种三路病理语音识别模型;最后,结合语音特征信息进行病理语音识别模型训练和测试。实验结果表明,LMD-GFbank图谱特征在三路病理语音识别模型上的识别率达到了93.36%,优于传统MFCC、GFCC、Fbank特征的语音识别效果,验证了所提算法及识别模型能提升病理语音识别准确率。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分