咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于改进时延神经网络的说话人识别方法 收藏

基于改进时延神经网络的说话人识别方法

Speaker Recognition Method Based on Improved Time Delay Neural Network

作     者:胡贵超 HU Guichao

作者机构:南京理工大学计算机科学与工程学院南京210018 

出 版 物:《计算机与数字工程》 (Computer & Digital Engineering)

年 卷 期:2023年第51卷第12期

页      面:2827-2830页

学科分类:07[理学] 081104[工学-模式识别与智能系统] 08[工学] 070104[理学-应用数学] 0701[理学-数学] 0811[工学-控制科学与工程] 

主  题:说话人识别 时延神经网络 量化和计数算子 qco-vector 

摘      要:提出了一种改进的时延神经网络(Time Delay Neural Network,TDNN)的说话人识别方法以提高说话人识别准确率。首先通过TDNN网络训练音频的特征获取部分说话人的特征表达,然后由加入的量化和计数算子(Quantization and Counting Operators,QCO)同时处理,QCO能够充分利用音频的低层纹理特征,得到特征的细节信息。实验结果表明,改进的时延神经网络在相对较少的数据量中即可由网络训练获取更多信息的特征表达,在小数量训练集网络中体现出明显优势。当数据量进一步增多时效果更为明显,训练加入了纹理统计方法的结构提取的细节特征使说话人识别表现更好。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分