咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于改进时延神经网络的带噪声纹识别算法研究 收藏
基于改进时延神经网络的带噪声纹识别算法研究

基于改进时延神经网络的带噪声纹识别算法研究

作     者:罗娅娅 

作者单位:贵州师范大学 

学位级别:硕士

导师姓名:杨乘

授予年度:2021年

学科分类:0711[理学-系统科学] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:声纹识别 噪声 时延神经网络 残差神经网络 批量归一化 ResTDNN 

摘      要:目前深度神经网络被越来越多的研究人员用于声纹识别技术中,尤其是时延神经网络(TDNN),时延神经网络应用于声纹识别时随着网络深度的增加会存在一定的局限性影响识别效果。本文针对时延神经网络存在的不足进行了改进,提出了一种改进时延神经网络的带噪声纹识别算法。首先,由于TDNN网络深度增加的同时,精度会逐渐达到饱和从而使网络性能迅速退化,但此现象并非由过拟合引起,而是因为随着训练层数的增加,误差也随之增大,训练时产生的误差致使网络退化现象的发生,使网络训练效果不佳。本文利用残差神经网络的输入层能对输出层进行不断修正以减少信息损失的特点,提出了一种基于残差神经网络的声纹识别算法,即在时延神经网络中直接引入残差短路连接,利用残差能减少损失的特点缓解时延神经网络退化现象以及提高系统的鲁棒性。在时延神经网络结构中直接引入残差神经网络并设计了三组实验方案,找到了残差短路连接的最佳方案,结果表明,在TDNN1层和TDNN4层引入二层残差神经网络的效果最好,可以把残差神经网络输入层能对输出层进行不断学习修正的特点发挥得更好,在提高精度的同时更加保证了信息的完整性,提高了系统整体的声纹识别率。其次,随着时延神经网络中隐藏层数目的增加,容易出现梯度消失或梯度爆炸的现象,致使神经网络无法收敛。而梯度消失或梯度爆炸现象的发生直接影响了该算法在噪声环境下的声纹识别率。本文从解决此问题的角度出发,采用批量归一化处理使每一层的平均值和方差限制在一定范围内来减少移位协方差,从而提高了网络泛化能力。提出了一种基于批量归一化的声纹识别算法(BN-TDNN),在时延神经网络除输出层外的每一层都加入批量归一化处理。实验结果显示,与基线系统数据相比,基于BN-TDNN网络结构的系统的声纹识别率得到一定的提升。最后将以上两种算法结合在一起设计了一种带噪声环境下改进时延神经网络的声纹识别算法,即在时延神经网络中直接引入残差神经网络和批量归一化处理,并对改进的时延神经网络(ResTDNN)带噪声纹识别系统进行了实验和分析。通过在Aishell-1数据集上的实验结果表明,与TDNN算法相比,ResTDNN算法在无噪声环境下及带噪声环境下的等错误率(EER)分别相对降低30.4%和35.8%。实验结果证实,无论是在无噪声环境还是带噪声环境下,ResTDNN算法的系统性能均比残差或批量归一化单独用于时延神经网络系统的性能更有效,声纹识别率也均高于TDNN算法,从而验证了ResTDNN网络用于声纹识别的有效性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分