资源匮乏多语言的语种辨识技术研究
Research on Language Identification Technology for Multi-Languages with Scarce Resources作者机构:新疆大学信息科学与工程学院新疆乌鲁木齐830046
出 版 物:《计算机仿真》 (Computer Simulation)
年 卷 期:2022年第39卷第12期
页 面:336-341页
学科分类:08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(.61662078) 国家重点研发计划(2017YFC0820602)。
摘 要:针对现有的语种识别方法对资源丰富、同语系语言的研究较为密集,而对资源匮乏、跨语系语言的研究较少等问题,通过对MFCC、FBank、语谱图等多个特征以及CNN、GRU等多个模型的研究对比,提出了一种基于语谱图特征的CNN-BiGRU的语种识别模型。模型提取语音数据的语谱图,采用卷积网络获取语谱图的视觉特征;通过双向门控循环网络获取时序信息特征;使用全连接网络输出语言种类,实现了资源匮乏、同语系语言以及跨语系多语言的语种识别。在东方语种数据集上进行实验,获得了良好的结果并验证了该方法的有效性。