咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于线性预测能量谱系数的自然语音和耳语音的分类研究 收藏

基于线性预测能量谱系数的自然语音和耳语音的分类研究

Research on LPESC-based classification of natural speech and whispered speech

作     者:姚真真 胡金瑶 艾斯卡尔·艾木都拉 YAO Zhenzhen;HU Jinyao;ASKAR Hamdulla

作者机构:新疆大学信息科学与工程学院新疆乌鲁木齐830046 

出 版 物:《现代电子技术》 (Modern Electronics Technique)

年 卷 期:2023年第46卷第2期

页      面:85-90页

学科分类:07[理学] 08[工学] 070104[理学-应用数学] 081101[工学-控制理论与控制工程] 0701[理学-数学] 0811[工学-控制科学与工程] 

基  金:国防科技基础加强计划(2021-JCJQ-JJ-0059) 国家自然科学基金项目(U2003207) 

主  题:语音分类 语音识别 耳语音 线性预测能量谱系数 特征提取 频谱图切分 结果分析 效果验证 

摘      要:在进行语音识别之前对自然语音和耳语音进行预分类,再分别放入各自的识别系统,可以提高耳语语音识别系统的识别性能。基于此,文中提出一个新的特征线性预测能量谱系数(LPESC),在该特征的提取过程中,对提取到的频谱图进行切分,以便获取到更多的语音信息,并将其用于耳语音分类。此外,还特别设计4种不同的滤波器组,并将提取到的特征应用于7个分类器上。实验结果表明,密集的均匀三角滤波器组更加适合提取该特征,在7种传统分类器上均有较好的分类效果,其中SVM分类效果最好。最后,对比LPESC与传统特征(39维的LFCC和MFCC)在7种分类器上的分类效果,验证新特征的有效性。实验还发现,女生的耳语音有更好的分类效果。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分