基于模型的麦克风阵列语音增强方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:guangtoucx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号在实际通信中总会受到不同噪声的影响,导致质量下降,语音增强的目的是从带噪语音中尽可能地提取纯净的原始语音。相比单通道语音增强只能利用时频信息,麦克风阵列语音增强还可利用多路接收信号之间的空间相关性,增强指定方向的有用语音信号,抑制其他方向上的噪声或干扰,能较好地解决语音增强和失真之间的矛盾。麦克风阵列语音增强包括固定波束形成和自适应波束形成,广义旁瓣相消器(GSC)是麦克风阵列自适应波束形成的一种通用模型。GSC对空间相干的噪声具有较强的抑制能力,但是对空间非相干噪声的抑制能力不强,当非相干噪声与相干噪声并存时,输出的增强语音存在的残余噪声较多。另外,GSC是针对一般输入信号设计的,没有利用语音信号的先验知识和针对语音信号的特点进行优化。针对以上不足,本文提出基于模型的麦克风阵列语音增强算法,对GSC辅助支路的非相干噪声进行校正后建立噪声模型,并结合干净语音模型的先验知识来构造最佳语音滤波器,来对GSC主支路信号进行增强。实验表明,该算法比传统GSC性能有了明显的提高。本文的主要工作如下:1、概述麦克风语音信号处理模型,麦克风阵列语音增强算法发展历史和研究现状。2、介绍GSC和子带波束形成基础理论,以及基于统计模型的语音增强算法。3、提出一种基于统计模型的GSC自适应波束形成麦克风语音增强算法。该算法先用干净语音库训练出干净语音倒谱域和频谱域模型,再对GSC辅助支路的非相干噪声进行校正,建立噪声模型。然后利用统计模型的先验知识,计算出带噪语音模型和滤波器权重,构造出最佳滤波器,对GSC主支路的带噪语音进行语音增强。4、对所提的基于模型的GSC算法进行实验仿真,测出模型最佳分类数,并将其和TF-GSC、Frost、基于模型算法、基于后置滤波的GSC算法在不同带噪环境中进行性能对比。实验表明,在高斯白噪声条件下,该方法PESQ平均分比传统GSC平均高了0.67分,提高了31.4%。在高斯白噪声和干扰音乐同时存在的条件下,该方法比传统GSC的PESQ得分平均高0.57分,平均提高了27.8%。由此可见本文提出的基于模型的GSC算法在不同带噪环境下有较好的语音增强性能,语音质量得到了明显的改善。
其他文献
将非线性规划、随机模拟与多体系统发射动力学与引信机构动力学结合,建立了基于系统动力学仿真的引信故障自动分析系统,能够对引信机构在多种弹道环境下的动态特性进行数值仿真
目的观察二氯醋酸二异丙胺治疗酒精性脂肪肝的临床疗效。方法 67例酒精性脂肪肝患者随机分为两组,观察组34例患者给予二氯醋酸二异丙胺治疗,对照组33例患者给予阿托莫兰治疗,
采用数值模拟方法对燃气二次喷射推力矢量控制系统关闭过程中非定常效应进行研究。给出了主/次流瞬态干扰流场结构逐渐弱化消失的流场细节特性,分析了流动参数和发动机内弹道性