大词汇量连续语音识别解码器优化研究与实现
作者单位:北京大学言语听觉中心机器感知与智能教育部重点实验室 北京大学
会议名称:《第十二届全国人机语音通讯学术会议(NCMMSC'2013)》
会议日期:2013年
基 金:973课题:中文言语语义结构体系构建及言语深度理解(2013CB329304) 国家自然科学基金(No.91120001) 国家社科基金重大项目(No.12&ZD119)的支持
关 键 词:语音识别 解码算法 语言模型look-ahead CUDA
摘 要:本文针对动态扩展解码空间的大词汇量连续语音识别解码器的优化展开研究工作。在不改变识别结果的条件下,分别从声学模型似然打分,词尾语言模型得分查找,语言模型look-ahead得分计算三个方面入手,采用了SSE、GPU加速,非保序完美哈希,静态的look-ahead得分表等方法。特别地,针对静态的look-ahead得分表的方法,提出了基于文法词历史中词的联合概率进行筛选的策略。实验证明上述方法能够在一定程度上提高解码速度,综合使用上述方法,能够使得系统由2.0倍实时提高到约1.3倍实时。