咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于HMM的连续语音识别系统的设计 收藏
基于HMM的连续语音识别系统的设计

基于HMM的连续语音识别系统的设计

作     者:潘莹 

作者单位:中南民族大学 

学位级别:硕士

导师姓名:张莉

授予年度:2016年

学科分类:0711[理学-系统科学] 07[理学] 

主      题:语音识别 隐马可夫模型 HTK MFCC 

摘      要:语音识别是让机器能够“听懂人类的语言,并把人类的语音信号转化为相应的文本或命令的技术。语音识别是一门涉及面很广的交叉学科,它与声学、语言学、人工智能、神经心理学、数字信号处理、计算机科学等学科都有着密切的联系。语音识别的应用范围非常广泛,比如语音打字机、数据库检索、汽车语音导航等等。围绕语音识别介绍了语音识别的三种基本方法,基于声道模型和语音知识的方法、模板匹配的方法以及人工神经网络的方法。在模板匹配方法中最常用的方法有三种:动态时间规整(DTW)、隐马尔可夫(HMM)理论、矢量量化(VQ)。本设计采用的是基于HMM方法实现的语音识别,大多数的大词汇量、连续的、非特定人语音识别系统也都是基于HMM模型实现的。本设计是基于HTK平台,以HMM为模型,选取MFCC为特征参数,Viterbi算法作为识别基础,实现了中等词汇量、非特定人、连续语音识别系统的设计。本设计中训练句子200个,测试句子100个,测试句子正确识别了87个,句子识别率为87%。测试的句子中总共包含800个词,其中正确识别771个词,词的识别率为96.38%。通过对比单音素建模、三音素建模以及决策树绑定的三音素建模,最终得出决策树绑定的三音素HMM模型识别率最高,基于上下文相关的HMM模型具有较强的抗噪能力和稳定性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分