咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >汉语连续语音识别中上下文相关的声韵母建模 收藏

汉语连续语音识别中上下文相关的声韵母建模

Context dependent initial/final acoustic modeling for continuous Chinese speech recognition

作     者:李净 郑方 张继勇 吴文虎 

作者机构:清华大学计算机科学与技术系智能技术与系统国家重点实验室北京100084 

出 版 物:《清华大学学报(自然科学版)》 (Journal of Tsinghua University(Science and Technology))

年 卷 期:2004年第44卷第1期

页      面:61-64页

核心收录:

学科分类:0810[工学-信息与通信工程] 0711[理学-系统科学] 07[理学] 081203[工学-计算机应用技术] 08[工学] 0805[工学-材料科学与工程(可授工学、理学学位)] 0835[工学-软件工程] 0701[理学-数学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主  题:汉语 连续语音识别 上下文相关 声母 韵母 决策树 

摘      要:声学建模是汉语连续语音识别中的关键步骤之一。根据汉语语音的特点,采用扩展声韵母(XIF)作为识别基元,并针对XIF基元设计了相应的问题集,利用基于决策树的状态共享策略建立上下文相关声韵模型(Tri-XIF)。将Tri-XIF模型与上下文相关音素模型(Tri-phone)、上下文无关音节模型进行了对比。提出了几种方法用于改善标注、改进问题集和降低模型规模。实验结果表明,Tri-XIF模型与Tri-phone模型、音节模型相比,识别性能有了很大提高,其音节误识率分别降低了24.53%和41.65%。采用了所提出的优化策略后,模型规模降低20%以上,而性能下降很少。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分