基于双微阵列的声源定位技术研究
作者单位:桂林电子科技大学
学位级别:硕士
导师姓名:王健
授予年度:2020年
主 题:双微阵列 语音端点检测 SRP-PHAT算法 神经网络 声源定位
摘 要:在音视频会议、机器人及语音识别等应用领域中,阵列信号处理技术起到了举足轻重的作用。语音定位本身属于阵列信号处理技术领域的一个重要组成部分。在噪声较大及混响较强的实际环境下,常用声源定位算法的鲁棒性较差。相位变换加权的可控响应功率定位算法(SRP-PHAT)具有一定的抗混响能力,但抗噪声能力较差且算法的计算量较大。为了减小SRP-PHAT定位算法的计算复杂度,提升强噪声、高混响环境下声源定位算法的性能,主要做了以下工作:1.简单介绍了几种使用频率较高的麦克风阵列,并引入双微阵列模型。采用真人读取语音进行了基于双微阵列的实际环境语音录制。2.为了解决普遍存在的低信噪比时端点检测效果较差的问题,研究了一种新的检测法。此方法引进调制域谱减法去除信号的部分噪声,并把信号的经验模态分解和对数能量除以相关函数主副峰比值结合,最后进行端点检测。实验结果显示,在信号信噪比较低时,检测的正确率大部分在90%以上,算法的检测性能较好。3.对SRP-PHAT算法中的广义互相关函数(GCC)的权值做了改进,将平滑相关变换(SCOT)函数和相位变换(PHAT)函数结合,组成新的加权函数。研究了改进加权SRP算法结合BP(back propagation)网络的双微阵列声源定位方法。该方法将5°为一个跨度的低分辨率搜索空间按其理论信号接收时间差(TDOA)进行区域划分,较SRP全搜索方法减少了99.5%的搜索空间。将每个区域的质心坐标作为代表坐标,求取代表坐标的TDOA作为搜索空间查找表,将查找表的改进加权SRP功率值作为网络的输入特征,通过网络的不断学习,输出声源的位置估计。仿真实验表明,算法的定位性能较好,方位角预测的平均正确率为97.8%,仰角估计的平均正确率为98.5%,距离预测的平均正确率为99.8%,声源位置定位的正确率为96%,较SRP全搜索方法提高了68%的定位精度,减少了99.7%的定位时间。