基于加权主成分的短语音说话人识别研究
作者单位:华南理工大学
学位级别:硕士
导师姓名:殷瑞祥
授予年度:2017年
摘 要:短语音下的说话人识别研究是说话人识别技术走向实际应用的一个重要研究领域。实际交互系统中,为了做到用户友好性,往往不能要求用户提供过多的语音,因此如何在满足性能要求的情况下,选取适宜的测试样本长度,增强样本中所含的说话人个性信息,抑制语义信息,是十分重要的。本文在分析了基于统计的识别模型与说话人特征参数的基础上,针对识别性能对样本长度的依赖性,研究了识别性能与测试样本长度之间的关系,并提出了一个指数函数模型。通过该函数模型选择有效的样本长度,有助于优化系统性能。在分析了主成分分析方法的基础上,提出了修正的增减分量法用于评价主成分分析中各主成分分量的贡献率。针对主成分分析对语义的分离作用及各主成分对说话人识别的贡献率,提出了加权的主成分算法,抑制了语义信息,增强了说话人个性信息。实验表明,该算法在有效的测试样本长度区间内可以提高识别率。通过实验与分析,结果表明,识别性能与测试语音样本长度之间可以用一个指数函数模型描述,测试语音样本在2-6s内时能达到较优的系统性能;测试语音在2-6s的有效长度区间时,本文的加权主成分算法将说话人识别率提高了约2.86%。