论文部分内容阅读
语音增强技术广泛应用于各种实际的语音处理系统中,是语音信号处理的一个重要的分支。在实际应用的语音处理系统中,待分析的语音信号通常是被噪声污染的带噪语音,正是由于环境噪声的存在,从而严重影响了语音处理系统的性能。为了进一步提高语音处理系统的信号处理能力,就必须对带噪语音进行语音增强处理,抑制噪声,恢复纯净语音。本文首先简要介绍了语音增强技术的基本概念,概述了语音增强常用的几种算法以及相关的评价方案,然后重点研究了基于小波分析技术的语音增强算法以及谱减语音增强算法。小波是一种灵活的时频分析技术,能够对信号进行有效的时频分解,适合对语音这类非平稳信号进行处理,因此本文详细介绍了小波和小波包的基本原理和性质,并分析了相关的阈值收缩算法。传统的基于小波包的语音增强算法存在过度阈值处理的现象,即在信号处理的过程中不但去除了噪声还将部分有用的语音信息也抑制掉,从而影响了最终的增强结果。针对这种情况,本文提出了一种改进的小波包去噪阈值的计算方法,首先使用听觉感知小波包对带噪语音进行分解,得到小波包的分解系数,然后通过跟踪小波包节点的时间帧能量的变化来估计语音出现的概率,进而利用该概率值调节去噪阈值,从而得到小波包去噪的时间自适应阈值。最后基于Matlab软件平台将改进的小波包语音增强方案与传统的小波包语音增强方案进行对比实验,结果表明改进的阈值更好地避免了语音小波包系数被过度阈值处理,从而在抑制噪声的同时保留了更多的纯净语音成分,进一步改善降噪效果。此外,本文还重点研究了潜减语音增强算法,谱减算法是一种传统的语音增强算法,其计算简单、实时性好,因此得到了广泛的应用。但是传统谱减算法中的噪声功率谱仅仅是通过在无声段平滑得到的,因此其估计得到的噪声功率谱与实际值之间存在着较大的差别,从而影响了最终的去噪效果。为了进一步提高谱减法的性能尤其是在非平稳噪声环境下的噪声抑制能力,本文提出了一种改进的谱减语音增强算法,其在进行噪声的功率谱估计时,首先使用频点方差算法进行端正检测,如果检测是无声段则直接更新噪声的功率潜,否则,则将带噪语音的功率谱进行Bark分带,然后利用最小统计量控制递归平滑的方法估计噪声的功率谱。由于该算法充分考虑到了语音的频率特性和人耳的听觉感知特性,因此能够更好地跟踪噪声变化,而且具有比较好的实时处理能力。此外,改进的谱减法还使用了自适应的过减因子和频谱阶因子,因此能够具有更好的去噪性能。最后,我们基于Matlab环境分别对传统的谱减法和本文的改进算法在电子耳蜗ACE方案中应用进行仿真对比实验,验证了改进谱减算法的有效性和可行性。论文的最后对论文所做的工作进行了总结,并指出了实验中存在的不足和下一步研究的方向。