论文部分内容阅读
语音增强是一种当语音通信系统的输入或输出信号受到噪声干扰时提高其性能的技术。它的主要目的是降低背景噪声,提高语音质量或抑制同声道语音干扰。简单的讲,就是从带噪声语音信号中提取尽可能纯净的原始语音。
人们在语音通信过程中,常常会受到环境噪声的干扰而使通话质量下降。噪声不仅影响语音的质量和清晰度,而且还造成人耳的听觉疲劳,妨碍正常的语音通信。在这种情况下,有必要采用语音信号处理的方法对带有噪声的语音进行增强处理,抑制背景噪声,提高语音通信质量。因此,研究语音增强算法在实际中有广泛的应用价值。
本论文主要从以下两个方向进行增强算法的研究:短时谱估计语音增强算法和在小波包变换语音增强框架结构下的语音增强算法。传统基于短时谱估汁的语音增强算法尽管都可以在一定程度上消除噪声,但是都会在不同程度上产生“音乐噪声”。Ephraim和Malah提出的基于MMSE估计算法能够在一定程度上抑制残留的“音乐噪声”,但是没有给出理论的解释。OliverCappe研究得出结论:先验信噪比和后验信噪比有相似的轮廓,但是比后验信噪比延迟了一帧。这个偏差是因为EMSR中直接判决算法(Decision-Directed)用前面的语音帧功率谱来估计当前帧的先验信噪比,使得当前语音帧的噪声抑制增益估计不准确,从而导致残留“音乐噪声”的产生。本文结合谱增益观点和基于直接判决先验信噪比估计算法,采用了一种基于谱增益迭代先验信噪比估计的改进算法。首先利用先验和后验信噪比的初始估计值算出谱增益的初始值,然后按照传统的谱增益语音增强方法,求出初次纯净语音的估计值,然后利用纯净的语音估计值计算出新的先验信噪比,进而得到新的谱增益,如此反复,逐步更新、逼近纯净语音信号估计值,达到语音增强效果。除此之外,传统的语音增强算法如谱减法适用于信号是平稳的且具有明显区别于噪声的谱特性的情况,若应用于非平稳信号时则存在着无法克服的弱点,并且消噪效果不明显;用维纳滤波和卡尔曼滤波方法消噪时,需要知道一些先验知识。基于小波变换的语音增强算法可以很好处理非平稳信号。它具有自适应性,先验知识需要的少;消噪效果明显。为了取得更好的效果,本文采用基于小波包变换的语音增强算法,所作的工作包括基于人耳模型的小波包分解;自适应阈值估计和软门限函数和改进的硬门限函数相结合三个方面。仿真试验证明上述两种方法可以很好地解决传统语音增强算法中存在的相应问题,并且消噪效果明显。