咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >视频会议发言者语音的偏好转移矩阵识别方法 收藏

视频会议发言者语音的偏好转移矩阵识别方法

Preference Transfer Matrix Recognition Method for Speaker Speech in Video Conference

作     者:杨斌 李庭瑞 李俊杰 罗睿 涂珂 胡施琦 YANG Bin;LI Tingrui;LI Junjie;LUO rui;TU Ke;HU Shiqi

作者机构:北京中电飞华通信有限公司北京100071 

出 版 物:《网络新媒体技术》 (Network New Media Technology)

年 卷 期:2022年第11卷第6期

页      面:35-41页

学科分类:0711[理学-系统科学] 07[理学] 08[工学] 081104[工学-模式识别与智能系统] 0811[工学-控制科学与工程] 

主  题:偏好转移矩阵 数据库 视频会议 发言者语音 自编码器 Softmax分类器 

摘      要:为了识别视频会议发言者语音,扩大语音识别精度,研究基于偏好转移矩阵与数据库的视频会议发言者语音识别方法。提取有价值的语音信息,结合矢量量化与规整网络,生成有价值语音的音节状态偏好转移矩阵,将数个训练后的稀疏自编码器叠加,构成自编码神经网络,逐层训练该网络后,输入至Softmax分类器中,完成会议发言者语音识别。实验结果表明,该方法应用后,在2层隐含层、500个神经元的神经网络结构下,识别率最高可达到96.55%,具有最佳的语音识别效果,且所识别语音与初始实验发言者语音几乎吻合,识别精度高,识别效果理想。提高视频会议通信质量,保障用户体验。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分