咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >安全监控中声音识别的研究 收藏
安全监控中声音识别的研究

安全监控中声音识别的研究

作     者:台龙飞 

作者单位:上海应用技术大学 

学位级别:硕士

导师姓名:林伟;殷鹏程

授予年度:2019年

学科分类:0711[理学-系统科学] 07[理学] 

主      题:声音监控 语音增强 声音情感 遗传算法 C-SVM 

摘      要:人类发出的语音可以很好的表达出自身的情感,故本文研究如何利用人类语音中所包含的情感来对公共场合的安全进行监控,开展工作内容如下:考虑到声音监控设备采集到的公共场合声音会包含过多的干扰噪音,需要对声音信号进行语音增强处理。传统谱相减法,对无语音段噪声能量的设定是噪声的平均能量,而平均能量易受随机冲激噪声的影响,一般会导致噪声平均能量过大,进而导致谱相减算法中语音信号频谱的损失。本文对传统谱相减语音增强算法进行了改进,将噪声能量比引入到谱相减算法中,利用噪声能量比约束过大的噪声均值能量。实验表明,改进的谱减法不仅降低了语音信号频谱损失的风险,而且还抑制了声音信号中的噪声。考虑到尚未有研究成果来明确公共场合声音中所包含的情感,本文对公共场合声音中包含的情感进行分类,分别是正常情感、危险情感、热闹情感和冷清情感。收集来自不同场景情感的声音,建立场景声音库。结合国际语音情感识别竞赛的语音特征集和语音韵律特征来提取四种类型的场景声音特征。考虑到惩罚参数C和RBF核函数宽度δ对C-SVM模型分类的影响,本文将遗传算法和非线性规划相结合,增强全局和局部的搜索能力,以优化惩罚参数C和核函数宽度δ。实验证明,随机选取的参数C和δ,对场景声音情感的识别只能达到35%的准确率。而对于最优化选取的参数C和δ,识别的准确率可达到77%。其中,正常场景情感和冷清场景情感的识别率最为稳定也最高,一般可达到90%。危险场景情感和热闹场景情感之间最易混淆,识别率在60%至80%之间,影响了公共场合声音情感的整体识别率。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分