基于SONAR平台的说话人识别算法改进研究
作者单位:浙江大学
学位级别:硕士
导师姓名:吴朝晖;杨莹春
授予年度:2003年
主 题:说话人识别软件平台(SONAR) 言语过滤识别 二次特征提取 模型得分归一化 渐进等分法 互联环境说话人鉴别系统 电话提示性验证系统
摘 要:本论文提出并实现了一种新型的基于组件的说话人识别软件平台(Speaker recOgnitioN softwAre platfoRm: SONAR)。SONAR提供了说话人语音数据库采集、性能测试以及说话人识别算法评测等功能,应用前景广阔。 SONAR可同时支持说话人识别与语音识别。它提供了多种说话人识别方法与算法,具体包括语音采集、预处理、特征提取、声学建模以及判决。在设计与实现过程中,本文提出并实现了以下新的方法与算法: 1.言语过滤识别方法:一种新型的说话人识别方法。它利用了语音识别对语音进行语义检验,从而过滤了复杂背景的影响,进而提高了识别性能。言语过滤识别方法是原有的与文本相关的说话人识别和与文本无关的说话人识别两种方法的重要补充。 2.二次特征提取:结合声学模型特点综合比较后得到的一种新颖处理方式。它通过综合运用加权、微分、组合、筛选等方法,进一步挖掘说话人语音背后的隐性个性差异。在采用138人的YOHO数据库上进行的说话人识别测试中,其性能优于传统的特征提取方法。 3.模型得分归一化与渐进等分法:考虑到分类器得分的依赖性与现有的验证性能计算的复杂性,提出了新的模型得分归一化方法优化分类器性能,以及一种新的渐进等分法计算等错误率。新的反全局模型归一化以及训练模型自归一化对说话人验证性能有不同程度的提高。此外,本文比较了渐进等分法与传统的阀值分析图法和接受者操作特性曲线图法在计算等错误率的优缺点。最后,针对YOHO数据库的说话人验证得分,验证了以上算法。 最后,本文提出并实现了两个基于SONAR的说话人识别应用系统。其一是互联环境说话人鉴别系统,它是针对互联环境的多种语音接入方式而研发的,来自个人电脑、掌上电脑、电话、手机的语音通过不同的接入途径(声卡、传输和语音调制解调器等)接入到SONAR软件平台。其二是电话提示性验证系统,它支持电话远程交互式验证,在保证识别性能的基础上增强了人机交互能力。