论文部分内容阅读
在实际的语音通信系统中,语音信号不可避免地要受到噪声信号的干扰。噪声的存在严重的导致了语音质量的降低,并影响人们对语音信息的辨识能力。为了改善语音信息质量,从含噪语音中获取尽可能的纯净的语音,就需要语音增强。语音增强是消除噪声干扰、解决噪声污染的一种有效的方法,其首要目标是尽可能的从背景噪声中提取出纯净的语音信号,以达到改善语音信号的质量和可懂度的目的。从当今国内外的研究发展成果来看,一些语音增强的方法可以降低背景噪声,改进语音质量,但仍会使非语音段遗留较多噪声,并存在产生特定噪声和语音畸变等问题,从而造成增强后的语音与原纯净语音相差较大。为了解决上述问题,本文结合语音增强与稀疏表示理论,提出了一种新型的基于DCT正交基稀疏表示的自适应谱减法。该算法中语音的重构需依据环境的噪声大小和特点选择一定的DCT矢量表示纯净语音,为了自适应选择合适的矢量,本文提出一种稀疏软阈值解决该自适应的问题。算法思想具体如下:首先,在训练阶段,通过VAD技术估计非语音段的噪声方差,将其作为初始稀疏阈值输入到双族群果蝇优化算法中估算出全局最优稀疏软阈值。其中,双族群果蝇优化算法是一种改进的果蝇优化算法,该算法有效地弥补了后者易收敛到局部极值等缺陷。其次,在语音重构阶段利用最优稀疏软阈值控制重构算法在迭代过程中对DCT系数矢量的选择,即选择适当的矢量表示纯净语音,从而达到压缩甚至过滤噪声的目的。其中,为了缩小重构语音与原纯净语音之间的误差,提出一种广义A*OMP算法作为重构算法,该算法相比A*OMP算法在语音重构精度和速度方面有很大提升,重构精度与BP算法相当。最后,由于DCT系数矢量的选择并非是最优的,故重构后的语音仍会残留少量噪声,为了进一步压缩被重构的噪声,则对重构语音进行噪声谱减。通过高斯白噪声情况和有色噪声情况的实验数据证明:在低信噪比环境下,本文提出的算法能有效地过滤了非语音段的噪声,压缩了语音段噪声,从而提高了语音质量和可懂度。