论文部分内容阅读
现实环境中,语音受到混响和背景噪声干扰,这些干扰降低了语音的听觉质量以及可懂度。因此对带噪语音进行语音增强处理很有必要。语音增强的主要目的可以归结两个——提升语音的质量以及提高语音的可懂度,这两个目的往往难以兼得。如何在不引入信号失真的前提下,抑制噪声干扰,成为语音增强的主要挑战。和单个麦克风相比,麦克风阵列能利用语音的时域信息以及阵列的空域信息对带噪语音进行增强,因而可以获得质量更高的增强语音。然而电子设备小型化的发展趋势,却要求麦克风阵列的尺寸不能太大。在此背景下,本论文研究了基于二元麦克风阵列的语音增强算法,主要工作如下:
详细阐述了固定波束形成、广义旁瓣相消器以及后置滤波器的算法原理,并分析了这些算法在二元麦克风阵列模型中的消噪性能。在不同噪声和信噪比条件下,通过仿真测试了这些算法的消噪性能。
分析了基于相干滤波器与广义旁瓣相消器结合的语音增强算法原理。在该算法中,相干滤波器被置于广义旁瓣相消器的非自适应支路上。这是一种经典的结合模式,通过分析发现该算法对相干滤波器存在限制。针对这一问题,提出了一种新的结合模式。该结合模式中,相干滤波器是广义旁瓣相消器的后置滤波器。这一模式克服了经典结合模式对相干滤波器的约束,可以使用消噪能力更强的改进型相干滤波器。
分析了基于迭代噪声功率谱密度(Power Spectral Density,PSD)估计的相干性滤波器算法,通过分析发现该算法存在噪声过估计的问题。针对这一问题,提出一种基于时间平滑参数的迭代噪声PSD估计算法。该方法利用时间递归平均技术,并结合迭代噪声PSD估计技术。与迭代噪声PSD估计算法相比,该估计算法获得的噪声PSD估计值更准确。
将上述改进迭代噪声PSD估计技术用于相干滤波器中,并把该相干滤波器同广义旁瓣相消器结合,从而得到一种基于相干滤波器与广义旁瓣相消器结合的二元麦克风阵列语音增强算法。不同噪声环境下的大量仿真实验表明,相比于经典结合模式下的语音增强算法,本文提出的算法可以获得质量更高的增强语音。
详细阐述了固定波束形成、广义旁瓣相消器以及后置滤波器的算法原理,并分析了这些算法在二元麦克风阵列模型中的消噪性能。在不同噪声和信噪比条件下,通过仿真测试了这些算法的消噪性能。
分析了基于相干滤波器与广义旁瓣相消器结合的语音增强算法原理。在该算法中,相干滤波器被置于广义旁瓣相消器的非自适应支路上。这是一种经典的结合模式,通过分析发现该算法对相干滤波器存在限制。针对这一问题,提出了一种新的结合模式。该结合模式中,相干滤波器是广义旁瓣相消器的后置滤波器。这一模式克服了经典结合模式对相干滤波器的约束,可以使用消噪能力更强的改进型相干滤波器。
分析了基于迭代噪声功率谱密度(Power Spectral Density,PSD)估计的相干性滤波器算法,通过分析发现该算法存在噪声过估计的问题。针对这一问题,提出一种基于时间平滑参数的迭代噪声PSD估计算法。该方法利用时间递归平均技术,并结合迭代噪声PSD估计技术。与迭代噪声PSD估计算法相比,该估计算法获得的噪声PSD估计值更准确。
将上述改进迭代噪声PSD估计技术用于相干滤波器中,并把该相干滤波器同广义旁瓣相消器结合,从而得到一种基于相干滤波器与广义旁瓣相消器结合的二元麦克风阵列语音增强算法。不同噪声环境下的大量仿真实验表明,相比于经典结合模式下的语音增强算法,本文提出的算法可以获得质量更高的增强语音。