论文部分内容阅读
由于人们在语音通信过程中不可避免地会受到来自周围环境、传输媒介引入的噪声,通信设备内部电噪声,乃至其它讲话者的干扰。这些干扰最终将使接收者接受到的语声已非纯净的原始语音信号,而是受噪声污染的带噪语音信号。例如,安装在汽车、飞机或舰船上的电话,街道、机场的公用电话以及现在人们常用的移动电话,常受到很强背景噪声的干扰,严重地影响通话质量。因此,语音增强技术就成为数字语音信号处理中的重要组成部分。 所谓语音增强就是对带噪语音进行处理,以改善语音质量。提高语音的清晰度、可懂度和舒适度,使人易于接受或提高语音处理系统的性能。大多数实用的语音增强系统均是由精确的噪声估计器和良好的滤波器来实现对带噪语音进行去噪。 传统的噪声估计方法是基于语音活性检测(Voice Activity Detection,VAD)的,具有简单,易实现的优点。但是实验证明,VAD在低信噪比的情况下对噪声特性的精确估计有很大的缺陷。而基于连续更新噪声谱的噪声估计方法,既可以省略VAD,又能较大地提高带噪语音的噪声估计精度,尤其在非平稳噪声或者是波动噪声(Fluctuating Noise)的噪声特性及时更新方面有良好的表现,在实际应用中取得了很好的效果。 在滤波器的设计方面,传统的基于短时谱分析的方法具有易实现,实用性强的特点。在数十年的研究中,新兴的方法层出不穷,有的借助于人耳的听觉特性,有的借助于新兴的数学工具,例如小波分解、隐马尔可夫模型(HMM)等等。但是很多方法离实用阶段还有很长的距离。同时,基于TURBO迭代的滤波思想有了很大的发展,尽管TURBO迭代为什么具有这么良好的滤波效果目前还是没有人能解释,但是这种迭代思想在编译码、图像滤波等各个领域都得到了很好的应用。于是本论文将TURBO迭代的滤波思想引入到语音增强算法中,提出TURBO语音增强算法,并得到了令人满意的结果。 本论文研究的是语音增强技术及其应用,并提出TURBO语音增强算法。下面是本文的主要工作: 1.对基于VAD的噪声估计方法和连续更新噪声谱的噪声估计方法进行了研究及比较,针对仿真结果分析了两类噪声估计方法的性能,并将两者结合起来,做出改进,应用于实际的增强系统。 2.系统地研究了各种语音增强方法,包括基于短时谱分析的语音增强算法、基于语音生成模型的语音增强算法、基于人耳听觉掩蔽效应的语音增强方法等。在此基础之上,提出了一种基于TURBO迭代滤波器的TURBO语音增强方法,并对各种算法进行了分析和比较。 3.在对噪声估计算法和语音增强算法的研究基础上,结合连续更新噪声谱的噪声估计方法和基于短时谱分析的语音增强算法设计了两种实用语音增强系统,针对仿真语音和真实语音均做出结果和分析,并应用于实际项目中。