咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于多域融合及神经架构搜索的语音增强方法 收藏

基于多域融合及神经架构搜索的语音增强方法

Speech enhancement method based on multi-domain fusion and neural architecture search

作     者:张睿 张鹏云 孙超利 ZHANG Rui;ZHANG Pengyun;SUN Chaoli

作者机构:太原科技大学计算机科学与技术学院山西太原030024 

出 版 物:《通信学报》 (Journal on Communications)

年 卷 期:2024年第45卷第2期

页      面:225-239页

核心收录:

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金资助项目(No.62372319) 教育部人文社会科学研究基金资助项目(No.23YJCZH299) 山西省重点研发计划基金资助项目(No.202102020101002) 山西省基础研究计划基金资助项目(No.20210302123216) 太原科技大学研究生联合培养示范基地基金资助项目(No.JD2022004) 太原科技大学研究生教育创新基金资助项目(No.SY2023040) 

主  题:语音增强模型 复数空间域映射 多域融合 复数神经架构搜索 低成本评估 

摘      要:为进一步提高语音增强模型的自学习及降噪能力,提出基于多域融合及神经架构搜索的语音增强方法。该方法设计了语音信号多空间域映射及融合机制,实现信号实复数关联关系的挖掘;围绕模型卷积池化运算特点,提出了复数神经架构搜索机制,通过设计的搜索空间、搜索策略及评估策略,高效自动地构建出语音增强模型。实验搜索到的最优语音增强模型与基线模型的对比泛化实验中,语音质量客观评价(PESQ)、短时客观可懂度(STOI)两大指标较最优基线模型均最大提升5.6%,且模型参数量最低。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分