论文部分内容阅读
经过40多年的发展,研究者们提出了许多语音增强算法,如谱减算法、维纳滤波算法和基于统计模型的算法。这些算法在平稳噪声环境下能取得较好的增强效果,而在处理非平稳噪声时,其算法性能下降严重。码书驱动算法克服了上述算法的局限性,即使在非平稳噪声环境下仍然能获得较好的增强效果。码书驱动算法将语音和噪声的自回归(Auto-Regressive,AR)系数作为先验信息进行线下训练存储在码书中,并在线上通过对数谱失真准则估计各自对应的AR增益,所获得的AR参数用于构建维纳滤波器,从而增强带噪语音信号。但是码书驱动算法仍然存在三方面不足:一是码书驱动算法的AR参数估计不准确,导致在静音段仍然残留大量背景噪声;二是该算法只考虑提高语音的幅度谱估计性能,却忽略了语音的相位谱估计;三是传统先验码书只对语音和噪声的谱包络建模,而没有对其谱细节进行建模,这造成增强语音的谐波间仍然残留大量的背景噪声。针对上述三点不足,本文提出了如下改进方法:1.针对码书驱动算法的AR参数估计不准确问题,本文提出了一种基于语音存在不确定度的码书驱动语音增强算法。该算法在原始Bayesian参数估计框架中考虑了两种假设,即语音存在假设和语音不存在假设。与传统方法不同,语音和噪声的AR参数的Bayesian估计是在两个假设条件下得到的AR参数估计的加权和,其中的加权系数是线上基于帧变化的语音存在概率(speech presence probability,SPP)和语音不存在概率(speech absence probability,SAP)。增强语音谱仍然由重构的维纳滤波器得到。由于所提算法在Bayesian框架中结合了SPP和SAP,因此能够提高AR参数的估计精度。2.针对传统码书驱动算法忽略语音相位谱估计的问题,本文提出了一种纯净语音相位谱估计算法。该算法利用纯净语音、噪声和含噪语音之间的向量关系得到含噪语音与纯净语音相位差的余弦表达式,进而利用反余弦函数和含噪语音的相位得到纯净语音的相位估计。所估计的语音相位谱取代传统含噪语音相位谱与增强语音幅度谱相结合来得到纯净语音信号,进一步提高了低信噪比下的增强语音的感知质量。3.在前述的基于语音存在不确定度的码书驱动算法中,SPP和SAP存在估计精度不高以及无法抑制增强语音谐波间噪声的问题,为此,本文提出了一种基于贝叶斯AR参数估计的码书驱动语音增强算法。为了提高SPP和SAP的估计精度,该算法结合当前帧和过去帧的含噪语音信号来估计语音和噪声的AR参数。同时,利用隐马尔可夫模型(Hidden Markov Model,HMM)理论来推导SPP和SAP,并利用归一化互相关系数对HMM中语音存在状态和语音不存在状态之间的转移概率进行调整,此外,该算法将基于频点的语音存在概率与维纳滤波器相结合,有效抑制了增强语音谐波间的噪声。实验证明,所提算法要优于参考算法。