用于语音识别置信度的发音特征各维度分析和子集优化
Analysis and subset selection of articulatory features for speech recognition confidence measures作者机构:中国科学院声学研究所中科信利语音实验室北京100190
出 版 物:《声学学报》 (Acta Acustica)
年 卷 期:2011年第36卷第3期
页 面:339-348页
核心收录:
基 金:国家科技支撑计划(2008BAI50B03) 国家自然科学基金(10925419 90920302 10874203 60875014)资助项目
主 题:置信度估计 语音识别 特征 发音 维度 优化 子集 隐马尔可夫模型
摘 要:提出了基于发音特征单个维度的置信度算法,并基于此对发音特征的各个维度展开分析。分析不仅验证了融合的必要性,同时也展示了发音特征各维度之间以及和隐马尔可夫模型之间的大量冗余。为了去除冗余,提出了用子集选择的方法进行优化。对比所有都用的情况,基于发音特征紧凑子集的语音识别置信度估计,在等错率上取得了12.7%的相对下降。把经过优化后的基于发音特征的语音识别置信度估计和基于隐马尔可夫模型的语音识别置信度进行融合,在保持集内识别率不损失的前提下,显著提高了语法外输入测试的拒识性能:在相同参数下,在开发集和测试集上分别取得了34%和35.3%的显著改善。