咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于图信号处理的多声源定位方法研究 收藏

基于图信号处理的多声源定位方法研究

Multi-source Localization Based on Graph Signal Processing

作     者:吴晓欢 李嘉宁 WU Xiaohuan;LI Jianing

作者机构:南京邮电大学通信与信息工程学院江苏南京210003 

出 版 物:《信号处理》 (Journal of Signal Processing)

年 卷 期:2024年第40卷第10期

页      面:1802-1812页

核心收录:

学科分类:0711[理学-系统科学] 07[理学] 

基  金:江苏省高等学校自然科学研究面上项目(23KJB510015) 

主  题:多声源定位 K-均值聚类 图信号处理 麦克风阵列信号处理 

摘      要:波达方向(Direction of Arrival,DOA)估计技术是语音增强和声学探测中的重要工具,对于语音机器人、视频会议、助听器和声呐等应用至关重要。最近出现的DOA估计新方法,例如图信号处理(Graph Signal Processing,GSP)方法,展现出优异的角度估计能力,有望提供更佳的声源DOA估计解决方案。然而,由于在多声源情况下GSP算法由邻接矩阵无法直接得到接收信号特征向量的正交补矩阵,导致多声源下GSP算法失效。为解决此问题,本文基于多源宽带语音信号的频域单源区域检测实现多声源分离,进而利用GSP和聚类算法实现宽带多声源的定位。具体而言,本文首先将GSP方法扩展到频域。其次,利用短时傅里叶变换将信号分为若干时频区域,筛选出单源主导的时频区域后,对其进行频域GSP单源定位。最后,对所有定位结果进行聚类,再通过加权平均获得最终的角度估计。我们利用LibriSpeech语音语料库构建声源信号进行多声源定位仿真,仿真结果证明,本文方法优于其他算法,较高信噪比下可将误差控制在3°以内。此外,我们使用圆形六阵元麦克风阵列,对实际录制的若干组录音数据应用所提算法进行定位测量,结果展示所提算法的定位误差更小,并在声源较为靠近时也能做到较好的分辨。

读者评论 与其他读者分享你的观点