基于LMD改进特征提取的三路病理语音识别
Three channel pathological speech recognition based on LMD improved feature extraction作者机构:中北大学信息与通信工程学院太原030024
出 版 物:《电子测量技术》 (Electronic Measurement Technology)
年 卷 期:2024年第47卷第12期
页 面:140-147页
核心收录:
学科分类:0711[理学-系统科学] 1002[医学-临床医学] 07[理学] 100204[医学-神经病学] 10[医学]
基 金:山西省基础研究计划项目(202203021221103)资助
摘 要:针对发音障碍患者发音不够清晰准确,导致病理语音识别率低的问题,提出一种基于LMD改进的Gammatone滤波器组图谱特征提取算法进行三路病理语音识别,首先,该算法采用LMD分解语音信号,对分解后的各语音分量做短时傅里叶变换后进行频率合成,提取滤波器组特征及其一阶、二阶差分特征,构成能获取病理语音有效局部特征的LMD-GFbank图谱特征;其次,为了进一步优化网络模型在训练过程中遗漏掉部分有效特征信息,提出一种三路病理语音识别模型;最后,结合语音特征信息进行病理语音识别模型训练和测试。实验结果表明,LMD-GFbank图谱特征在三路病理语音识别模型上的识别率达到了93.36%,优于传统MFCC、GFCC、Fbank特征的语音识别效果,验证了所提算法及识别模型能提升病理语音识别准确率。