骨传导虚拟声源外部化研究
作者单位:广州大学
学位级别:硕士
导师姓名:王杰
授予年度:2024年
学科分类:0810[工学-信息与通信工程] 08[工学] 081002[工学-信号与信息处理]
主 题:骨传导 外部化 双耳房间脉冲响应 头中定位 空间听觉
摘 要:骨传导(Bone Conduction,BC)是通过振动颅骨将声音传递到内耳的一种声音传输方式,与气传导(Air Conduction,AC)相比,骨传导具有开放耳道的优势,能够保证使用者在听到音频的同时还能兼顾对外界声音的感知,近年来,消费级的骨传导设备得到了市场的广泛认可。然而,目前关于声源外部化的研究主要集中在气传导,随着骨传导技术的不断发展和骨传导耳机的普及,骨传导虚拟声源外部化感知也受到了广泛的关注,但缺少相关研究。 本文研究了声音的混响成分和频谱细节对骨传导虚拟声源外部化感知的影响,为此,双耳房间脉冲响应(Binaural Room Impulse Responses,BRIR)被时间窗截断或混响能量被缩放,以此改变BRIR信号的混响成分。BRIR信号直达声的频谱被Gammatone滤波器组平滑处理,以此改变BRIR信号直达声的频谱细节。实验结果表明,在骨传导(开放耳道)、骨传导(堵塞耳道)和气传导三种刺激方式下的声源外部化实验结果并没有明显差异;对侧耳混响和同侧耳直达声的频谱细节对骨传导虚拟声源外部化感知的影响更大。本文计算了直达混响能量比(Direct-to-Reverberant Energy Ratio,DRR)、频率间的变化(Frequency-to-Frequency Variability,FFV)和双耳相干性(Interaural Coherence,IC),并发现声源外部化评分与DRR、FFV和IC有一定的对应关系。本文的研究为改善骨传导虚拟声源外部化感知的双耳合成进行了有益的探索,并为虚拟声重放中骨传导换能器对于气传导耳机的声源外部化感知的可替代性提供重要的参考依据。 本文的研究内容和创新之处概括如下: (1)本文提出了骨传导虚拟声源外部化感知的测量方法和实验设置,以此研究骨传导虚拟声源外部化感知的性能表现。 (2)本文研究了BRIR信号的长度、混响能量和直达声的频谱细节对骨传导虚拟声源外部化感知的影响。在此基础上,探讨了在骨传导(开放耳道)和气传导两种刺激方式下的虚拟声源外部化感知差异,实验结果表明,二者没有明显差异,说明在声源外部化感知方面,骨传导对气传导的可替代性较高。 (3)本文测量了骨传导换能器的辐射声,并使用泡沫耳塞堵塞每位受试者的耳道,从而达到抑制辐射声的目的。在此基础上,研究了在骨传导(堵塞耳道)的刺激方式下,受试者的虚拟声源外部化感知,并将该结果与受试者不堵耳时的骨传导虚拟声源外部化结果进行对比,发现二者没有明显差异,这表明骨传导换能器的辐射声对骨传导虚拟声源外部化感知的影响不大。 (4)本文计算了与声源外部化相关的单耳线索(DRR、FFV)和双耳线索(IC),并将计算得到的结果与实验结果进行对比,结果表明,稳健的骨传导虚拟声源外部化需要单耳线索和双耳线索共同作用,通过综合利用这些线索,能够更准确地感知声音来源的位置,从而实现更好的声源外部化体验。