论文部分内容阅读
语音信号在实际通信中总会受到不同噪声的影响,导致质量下降,语音增强的目的是从带噪语音中尽可能地提取纯净的原始语音。相比单通道语音增强只能利用时频信息,麦克风阵列语音增强还可利用多路接收信号之间的空间相关性,增强指定方向的有用语音信号,抑制其他方向上的噪声或干扰,能较好地解决语音增强和失真之间的矛盾。麦克风阵列语音增强包括固定波束形成和自适应波束形成,广义旁瓣相消器(GSC)是麦克风阵列自适应波束形成的一种通用模型。GSC对空间相干的噪声具有较强的抑制能力,但是对空间非相干噪声的抑制能力不强,当非相干噪声与相干噪声并存时,输出的增强语音存在的残余噪声较多。另外,GSC是针对一般输入信号设计的,没有利用语音信号的先验知识和针对语音信号的特点进行优化。针对以上不足,本文提出基于模型的麦克风阵列语音增强算法,对GSC辅助支路的非相干噪声进行校正后建立噪声模型,并结合干净语音模型的先验知识来构造最佳语音滤波器,来对GSC主支路信号进行增强。实验表明,该算法比传统GSC性能有了明显的提高。本文的主要工作如下:1、概述麦克风语音信号处理模型,麦克风阵列语音增强算法发展历史和研究现状。2、介绍GSC和子带波束形成基础理论,以及基于统计模型的语音增强算法。3、提出一种基于统计模型的GSC自适应波束形成麦克风语音增强算法。该算法先用干净语音库训练出干净语音倒谱域和频谱域模型,再对GSC辅助支路的非相干噪声进行校正,建立噪声模型。然后利用统计模型的先验知识,计算出带噪语音模型和滤波器权重,构造出最佳滤波器,对GSC主支路的带噪语音进行语音增强。4、对所提的基于模型的GSC算法进行实验仿真,测出模型最佳分类数,并将其和TF-GSC、Frost、基于模型算法、基于后置滤波的GSC算法在不同带噪环境中进行性能对比。实验表明,在高斯白噪声条件下,该方法PESQ平均分比传统GSC平均高了0.67分,提高了31.4%。在高斯白噪声和干扰音乐同时存在的条件下,该方法比传统GSC的PESQ得分平均高0.57分,平均提高了27.8%。由此可见本文提出的基于模型的GSC算法在不同带噪环境下有较好的语音增强性能,语音质量得到了明显的改善。