论文部分内容阅读
声源定位在军事、语音识别和语音增强等领域都具有重要的理论意义和实际应用价值。同时,它在完善机器人智能和扩展应用领域方面也具有深远的理论和实践意义。对于声源定位,系统简单、定位准确、计算量小和抗噪性能等是声源定位研究的关键问题。
本论文以人耳听觉机理为基础,结合Jeffress的神经“巧合假说”模型,采用两个传声器对噪声环境下的声源定位进行了深入的理论及实验研究。为扩大其应用范围奠定了理论基础。
本文的创新性工作包括:
1、研究了小波阈值去噪的方法,分析了含噪声信号的小波滤波特性,噪声在小波分解下的特性以及声源定位中噪声的复杂性和噪声在小波变换中的特点。从小波分解结构的角度对全局阈值方法进行了改进,提出了一种改进的基于二次小波分解全局阈值的声音去噪处理方法。为了验证该方法的有效性,在不同的信噪比下,分别与不同阈值方法进行了对比实验。实验结果显示,基于二次小波分解全局阈值的声音去噪的效果最好。该方法提高了信噪比,去除了大部分噪声,同时有效信号的能量也相当完整地保留下来,同时还能够很好地解决噪声对声音信号的干扰问题。
2、通过利用混合声音信号在频域内保持各自主频成分不变的特性,提出了一种基于主频分离的双耳声源定位的方法。在主频不变原则的基础上,研究了主频分离的基本原理,对给定混合声音信号和实时采集的混合音信号分别进行了主频分离实验,实验结果表明:该原理能够有效地实现混合声音信号主频成分的分离。建立了由两个传声器、两只声卡和一台计算机等硬件组成的声源定位系统,解决了采用两只声卡采集声音信号的关键性问题。实验结果表明:该声源定位方法能够有效地实现单个声源以及两个混合声源的方位估计。
3、基于人耳听觉机理的频率分析特性以及声音信号过零点特性,提出了一种分频过零点探测的双耳声源定位的方法。在研究双耳听觉过零点探测的基础上,研究了分频过零点探测的双耳声源定位的算法。根据主频探测原则,即探测占据优势频率信号的过零点原则,推导出了各通道滤波信号信噪比(SNR)与ITD的采样偏差和通道滤波信号中心频率的关系。设计了基于分频过零点探测的双耳声源定位的实现系统。基于人耳的听觉机理的频率分析特性,设计了听觉带通滤波器;建立了声音信号实时采集系统;设计了双耳声源定位的流程。分别对单个声源、两个混合声源以及三个混合声源进行定位实验,实验结果表明:1)具有加权SNR的ZCTD 方法对各种单声源以及多个声源都能获得准确的ITD估计;2)由于采用SNR加权的ZCTD方法,噪声对ITD 影响不大;3)与互相关(CC)方法相比,ZCTD方法能获得更加准确的ITD估计,即ITD均值更加靠近目标值以及ITD采样偏差值更小;4)通过对原声源去噪预处理,锐化了ITD直方图的峰值,减少了ITD值的散布,提高了定位准确性。