咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于原子模式的新音频事件检测 收藏
基于原子模式的新音频事件检测

基于原子模式的新音频事件检测

作     者:蔡梓文 

作者单位:华南理工大学 

学位级别:硕士

导师姓名:贺前华;江瑾

授予年度:2017年

学科分类:0711[理学-系统科学] 07[理学] 

主      题:新音频事件 矢量量化 模糊聚类 音频原子 准平稳 

摘      要:随着互联网技术的快速发展和手持录音设备的普及,人们可获取的音频数据呈爆炸式增长。为了有效管理、利用海量音频数据,对音频事件检测技术的研究成为一大热点。目前的音频检测算法主要针对预先定义的音频类型,而对新音频事件发现的研究相对欠缺。本文定义的新音频事件是指在未知的音频流中,人们可能感兴趣的一类音频事件,其数量在某一段时间内大于其他类音频事件。由于新音频事件的类型只有在将其检测出来之后才可得知,故新音频事件发现属于无监督学习的范畴。本文主要对传统的矢量量化方法进行改进,提出了一种基于原子模式的新音频事件发现方法,并通过实验验证其性能:1、在码本训练阶段,用多维正态分布表示码字,结合模糊聚类思想,使一个样本在码本训练划分时,可依概率隶属于多个码字,实现了“软分类,减少了量化误差;2、在码字搜索阶段,考虑目标音频事件的准平稳特性,提出了一种基于动态规划的编码方法。该方法对每一段音频的编码进行平滑,能减少冲击杂音等背景噪音的影响,提高系统在复杂的音频环境中的稳定性。3、在码字索引阶段,将包含样本数目较多的码字作为“高频码字,统计每一段音频中隶属于高频码字的帧数的比例,并以此为依据实现对新音频事件的筛选。4、设计并实现了一个新音频事件检测系统。实验表明,当目标音频类型占比达20%以上,或者目标音频时长是次大类音频的3倍以上时,系统普遍可实现新音频发现的目标。对目标音频样本的抽取也取得了良好的效果。综上所述,本文方法在对待处理音频集无先验知识的情况下,提供了一种发现新音频事件的解决方案,弥补了该场景下研究工作的欠缺。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分