基于Mellin变换的语音新特征与频率归正说话人自适应技术
SPEAKER NORMALIZATION AND NOVEL ROBUST SPEECH FEATURE BASED ON MELLIN TRANSFORM作者机构:中国科学院自动化研究所模式识别国家实验室邮编100080
出 版 物:《自动化学报》 (Acta Automatica Sinica)
年 卷 期:2000年第26卷第4期
页 面:478-484页
核心收录:
摘 要:为了减小由于说话人之间声道形状的差异而引起的非特定人语音识别系统性能的下降 ,研究了两种方法 ,一种是基于最大似然估计的频率归正说话人自适应方法 ,另一种是基于 Mellin变换的语音新特征 .在非特定人孤立词语音识别系统上的初步实验表明 ,这两种方法都可以提高系统对不同说话人的鲁棒性 ,相比之下 ,基于 Mellin变换的语音新特征具有更好的性能 ,它不仅提高了系统对不同话者的识别性能 ,而且也使系统对不同话者的误识率的离散程度大大减小 .