咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于三维卷积神经网络的虫音特征识别方法 收藏

基于三维卷积神经网络的虫音特征识别方法

Insect sound feature recognition method based on three-dimensional convolutional neural network

作     者:万永菁 王博玮 娄定风 WAN Yongjing;WANG Bowei;LOU Dingfeng

作者机构:华东理工大学信息科学与工程学院上海200237 深圳海关广东深圳518045 

出 版 物:《计算机应用》 (journal of Computer Applications)

年 卷 期:2019年第39卷第9期

页      面:2744-2748页

学科分类:08[工学] 0804[工学-仪器科学与技术] 

基  金:国家自然科学基金资助项目(61872143) 国家大学生创新创业训练计划项目(201810251064)~~ 

主  题:三维卷积神经网络 短时傅里叶变换 语谱图 虫音识别 声学信号处理 

摘      要:进口木材蛀虫检疫是海关的一项重要工作,但其存在着虫声检测算法准确率低、鲁棒性差等问题。针对这些问题,提出了一种基于三维卷积神经网络(3D CNN)的虫音检测方法以实现虫音特征的识别。首先,对原始虫音音频进行交叠分帧预处理,并使用短时傅里叶变换得到虫音音频的语谱图;然后,将语谱图作为3D CNN的输入,使其通过包含三层卷积层的3D CNN以判断音频中是否存在虫音特征。通过设置不同分帧长度下的输入进行网络训练及测试;最后以准确率、F 1分数以及ROC曲线作为评估指标进行性能分析。结果表明,在交叠分帧长度取5 s时,训练及测试效果最佳。此时,3D CNN模型在测试集上的准确率达到96.0%,F 1分数为0.96,且比二维卷积神经网络(2D CNN)模型准确率提高近18%。说明所提算法能准确地从音频信号中提取虫音特征并完成蛀虫识别任务,为海关检验检疫提供有力保障。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分