基于线性预测能量谱系数的自然语音和耳语音的分类研究
Research on LPESC-based classification of natural speech and whispered speech作者机构:新疆大学信息科学与工程学院新疆乌鲁木齐830046
出 版 物:《现代电子技术》 (Modern Electronics Technique)
年 卷 期:2023年第46卷第2期
页 面:85-90页
学科分类:07[理学] 08[工学] 070104[理学-应用数学] 081101[工学-控制理论与控制工程] 0701[理学-数学] 0811[工学-控制科学与工程]
基 金:国防科技基础加强计划(2021-JCJQ-JJ-0059) 国家自然科学基金项目(U2003207)
主 题:语音分类 语音识别 耳语音 线性预测能量谱系数 特征提取 频谱图切分 结果分析 效果验证
摘 要:在进行语音识别之前对自然语音和耳语音进行预分类,再分别放入各自的识别系统,可以提高耳语语音识别系统的识别性能。基于此,文中提出一个新的特征线性预测能量谱系数(LPESC),在该特征的提取过程中,对提取到的频谱图进行切分,以便获取到更多的语音信息,并将其用于耳语音分类。此外,还特别设计4种不同的滤波器组,并将提取到的特征应用于7个分类器上。实验结果表明,密集的均匀三角滤波器组更加适合提取该特征,在7种传统分类器上均有较好的分类效果,其中SVM分类效果最好。最后,对比LPESC与传统特征(39维的LFCC和MFCC)在7种分类器上的分类效果,验证新特征的有效性。实验还发现,女生的耳语音有更好的分类效果。