咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >音频分类技术研究 收藏
音频分类技术研究

音频分类技术研究

作     者:吴顺妹 

作者单位:哈尔滨工业大学 

学位级别:硕士

导师姓名:许洪光

授予年度:2009年

学科分类:0711[理学-系统科学] 07[理学] 

主      题:音频分类 音调分布特性 联合语音/音频编码 心理声学模型 线性预测编码(LPC) 

摘      要:语音和音乐是最重要的两类音频信息,音频信息处理在多媒体信息处理中占有重要地位。由于音频信息本身的特点,音频分类技术对于音频结构化有至关重要的作用,直接关系到对音频信息分析的深入程度和准确程度,以及音频内容语义的提取。 本文的主要工作和研究成果包括以下几个方面: (1)介绍了联合语音/音频编码的思想和实现框图,详细分析了一种音频clip和音频帧结合的音频特征分析与抽取方法,介绍了各种分类器与分类算法的设计,并简单介绍了两种典型的语音、音频编码器:码激励线性预测(CELP)和先进音频编码(AAC)。 (2)详细分析了现有的两种音频分类算法:基于LPC的音频分类算法和基于基音强度的音频分类算法,并通过实验对比其计算复杂度及分类准确率。 (3)在分析心理声学模型的基础上,利用心理声学模型1分析和抽取音频信号的音调特性(音调个数、低音调帧比例或子带音调个数比),并分析音频信号的时域特征参数(过零率或频谱倾斜度),提出了一种基于音调特性的音频实时分类算法。设计并对比多种实现方案的分类性能,得到最佳方案:利用子带音调个数比和频谱倾斜度对语音和音乐进行分类,并对分类结果进行平滑处理。 (4)通过实验对比分析了本文提出的音频分类算法与现有算法的分类性能。 实验结果显示,本文提出的音频分类算法较现有的分类方法有很大改进,有效地降低了计算复杂度,提高了分类精度,并实现了实时分类。因此,实用性较强。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分