论文部分内容阅读
语音信号作为信息的最普遍最直接的表达方式,在许多领域具有广泛的应用前景。然而在实际语音通信过程中,不可避免地会受到来自周围环境、传输媒介引入的噪声、通信设备内部电噪声、乃至其它讲话者的干扰。所有这些因素会造成接收到的语音信号并非纯净的原始语音信号,而是受噪声污染的带噪语音信号。为了从带噪语音信号中获得尽可能纯净的语音信号,减少噪音的干扰,就需进行语音增强。 在一般情况下干扰信号是随机信号,要完全排除噪音是不现实的,所以语音增强的目标对收听人而言主要是改善语音质量,提高语音可懂度,减少疲劳感;对语音处理系统(识别器、声码器、手机)而言是提高了系统的识别率和抗干扰能力。 本课题首先较全面总结了目前常用语音增强方法的分类和特点,然后对近几年新提出的多窗谱法进行了详细研究,分析了多窗谱法在语音增强中的应用原理、小波函数的选取等若干问题,并针对硬阈值、软闽值法的不足,采用了一种改进的小波阈值函数。同时,为了方便对语音信号的分析和应用开发,论文给出了我们自己研发的语音信号分析平台。针对开发过程中遇到的实际问题,提出相应的解决方法,其中包括多线程、波形曲线缩放等技术,并搭建了分析平台的整体架构和实现部分常用功能,为平台功能的进一步扩展奠定基础。 研究过程中,将传统的谱减法、STSA-MMSE法在语音增强中的效果与多窗谱法进行了实验对比。研究结果表明,多窗谱法的增强效果比其他两种方法更好。基于无语音帧带噪语音功率谱与噪声的功率谱相同的假设,噪声估计算法可通过跟踪无语音帧来更新噪声谱估计。该方法将带噪语音在频域上划分为三个频带,低频段:0-1kHz,中频段:1-3kHz,高频段:3kHz以上,并在三个频段上分别计算本频段与前一噪声估计中对应频段带噪语音的能量之比;再将能量比值与实验确定的阈值进行比较,根据比较结果确定出该帧是否为语音帧,从而采用不同的更新算法。 对环境变化较快的语音增强方法也进行了深入研究。实验中,采用改进的小