咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于CNN的连续语音说话人声纹识别 收藏

基于CNN的连续语音说话人声纹识别

Continuous speech speaker recognition based on CNN

作     者:吴震东 潘树诚 章坚武 WU Zhendong;PAN Shucheng;ZHANG Jianwu

作者机构:杭州电子科技大学浙江杭州310018 

出 版 物:《电信科学》 (Telecommunications Science)

年 卷 期:2017年第33卷第3期

页      面:59-66页

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:浙江省自然科学基金资助项目(No.LY16F020016) 国家重点研发计划经费资助项目(No.2016YFB0800201) 浙江省重点科技创新团队项目(No.2013TD03)~~ 

主  题:连续语音 语谱图 GMM-HMM 深度学习 

摘      要:近年来,随着社会生活水平的不断提高,人们对机器智能人声识别的要求越来越高。高斯混合—隐马尔可夫模型(Gaussian of mixture-hidden Markov model,GMM-HMM)是说话人识别研究领域中最重要的模型。由于该模型对大语音数据的建模能力不是很好,对噪声的顽健性也比较差,模型的发展遇到了瓶颈。为了解决该问题,研究者开始关注深度学习技术。引入了CNN深度学习模型研究连续语音说话人识别问题,并提出了CNN连续说话人识别(continuous speaker recognition of convolutional neural network,CSR-CNN)算法。模型提取固定长度、符合语序的语音片段,形成时间线上的有序语谱图,通过CNN提取特征序列,经过奖惩函数对特征序列组合进行连续测量。实验结果表明,CSR-CNN算法在连续—片段说话人识别领域取得了比GMM-HMM更好的识别效果。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分