基于融合特征以及卷积神经网络的环境声音分类系统研究
Environment Sound Classification System Based on Hybrid Feature and Convolutional Neural Network作者机构:航天飞行动力学技术重点实验室陕西西安710072 西北工业大学航天学院陕西西安710072 SignalsImagesand Intelligent Systems Laboratory(LISSI/EA 3956)University Paris-Est CreteilSenart-FB Institute of Technology36-37 rue Charpak77127 LieusaintFrance
出 版 物:《西北工业大学学报》 (Journal of Northwestern Polytechnical University)
年 卷 期:2020年第38卷第1期
页 面:162-169页
核心收录:
学科分类:0810[工学-信息与通信工程] 08[工学] 081105[工学-导航、制导与控制] 0805[工学-材料科学与工程(可授工学、理学学位)] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金重大项目(51890884) 国家自然科学基金(61976179,61502391)资助
摘 要:环境声音识别系统主要基于深度神经网络以及种类繁多的听觉特征对环境声音进行分类识别。分析基于深度神经网络的环境分类任务中,哪种听觉特征更适合环境声音识别系统十分必要。选择了基于2个广泛使用的滤波器:梅尔和Gammatone滤波器组提取的3种声音特征。随后,提出了一个MFCC和GFCC融合的特征MGCC。最后采用文中提出的深度卷积神经网络来验证哪种特征更适合于环境声音的分类识别。实验结果表明,在基于神经网络的环境声音分类系统中,信号处理特征比频谱图特征的效果好,其中,MGCC特征具有比其他特征更好的性能。最后,用文中提出的MCC-CNN模型与其他环境声音分类模型在UrbanSound 8K数据集上进行了对比。实验结果表明,所提模型分类精度最好。