论文部分内容阅读
语音通信已经成为现代社会生活的重要组成部分,然而人们在语音通信过程中不可避免地会受到来自周围环境的、传输媒介引入的、通信设备内部的噪声、乃至其它讲话者的干扰,这些干扰最终将使接收到的语音信号并非纯净的原始语音信号,而是受噪声污染的带噪语音信号。如果噪声污染严重,将会影响通信质量,造成人们听觉疲劳。因此,无论是人之间的通信还是人与机器之间的通信,通过语音增强算法对语音进行增强处理的需求变得越来越重要,因此语音增强技术的研究非常重要。本文主要研究单信道语音增强算法,即对带噪语音进行增强处理时只有带噪语音可作为参考信号,没有噪声信号可参考。
本文对Gaussian模型、Super-Gaussian模型和信号不确定性模型的基本理论进行了简要概括分析。分析了语音增强中常用的估计方法,这些估计方法主要有最大似然估计、最小均方误差估计和最大后验概率估计。研究了Gaussian模型、Laplacian模型和Gamma模型下的各种语音增强算法,这些算法主要包括Gaussian模型下的谱相减算法、MMSE(Minimum Mean Square Error)算法及其改进算法和Laplacian、Gamma模型下的MMSE算法。在语音增强中将语音信号的概率密度函数建模为Laplacian模型和Gamma模型的语音增强效果优于将语音信号建模为高斯模型的增强效果,在此理论基础上本文主要对这三种统计模型下纯净语音谱分量的MMSE估计算法进行比较,通过语音质量评测方法对三种模型下MMSE算法增强的语音进行测评,实验结果表明:Gamma模型下的MMSE算法增强效果较好,但其计算较复杂,实时性较差;Laplacian模型下的MMSE算法与Gamma模型下的MMSE算法有相似的特性,其对语音的增强效果优于高斯模型下的MMSE算法,而且计算比较简单。为进一步提高Laplacian模型下MMSE算法的效果,本文通过考虑人耳掩蔽效应对其进行了改进。
本文分析研究了目前常用的与掩蔽效应相结合的语音增强算法,这些算法主要包括Gaussian模型下谱相减算法与掩蔽效应相结合以及MMSE算法与掩蔽效应相结合。通过对这些算法的研究,将掩蔽效应应用于Laplacian模型下的MMSE估计算法中,使改进的算法能够有效消除噪声并减小语音失真,从而提高语音质量。本文选用段信噪比和语音感知质量两种客观语音评测方法对改进算法增强的语音进行测评,实验结果表明:考虑掩蔽效应的Laplacian模型下MMSE算法与原有算法相比较,噪声消除和减小语音失真都取得了较好的效果,提高了增强语音的质量。