基于GSC结构的麦克风阵列语音增强技术研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:snwkq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日常生活中麦克风所接收到的语音信号会被各种噪声所污染,这种现象是在所难免的。因此混合语音信号在处理之前通常先会对语音质量进行改善,而语音增强技术便可以用来对混合语音信号进行预处理,从而得到较为纯净的语音信号。与传统的单通道麦克风语音增强算法相比,麦克风阵列语音增强技术可以更好地处理复杂噪声环境中的方向干扰噪声,提高语音的清晰度。本文主要内容如下:1、阐述了包括GSC算法在内的几种经典麦克风阵列波束形成算法,并设置了简单与复杂两种声学环境,分别对GSC波束形成语音增强算法和固定波束形成语音增强算法在两种情况下进行实验分析及对比。由此得出GSC算法具有非相干噪声抑制能力差、信号自抵消的固有缺陷。2、针对GSC算法非相干噪声抑制能力差的缺陷,提出了一种基于谱减(Spectral subtraction,SS)法改进的GSC-SS语音增强算法,将改进后的谱减法作为后置与GSC算法进行级联,对归一化改进GSC算法的输出信号作功率谱减处理,实验结果表明,该算法可以有效改善GSC算法非相干噪声抑制能力弱的缺陷,但却容易产生“音乐噪声”。3、针对GSC-SS算法存在“音乐噪声”的不足,提出了一种基于Kalman滤波改进的GSC算法,将Kalman滤波算法作为后置,利用前刻状态与当前状态观测值估计当前值,将滤除方向性干扰噪声后的语音信号输出到级联的Kalman算法中,GSC输出信号所残余的背景噪声通过迭代最小均方误差进行噪声估计,从而抑制非相干噪声与麦克风阵元所产生的热噪声。实验结果表明,该算法在噪声抑制上与传统的GSC算法及后置谱减滤波算法相比具有明显的优越性,增强后的信号可保留更多有用信息。4、针对复杂噪声环境下GSC自抵消现象,提出了一种基于DNN改进的GSC算法。该算法通过多目标DNN代替GSC结构中的下层分支,依赖于DNN强大的数据拟合能力来改善自抵消现象。实验结果表明,相对于传统GSC算法,此算法具有很好的复杂噪声环境适应能力,相比传统GSC算法和本文所提另外两个算法,该算法增强后的语音更接近于目标语音信号。
其他文献
MEMS压阻式压力传感器是在气象探测和车联网等领域有着重要应用的前向通道接口。传统硅基压力传感器普遍具有低灵敏度、温度漂移和时间漂移等半导体器件固有的属性。本文提出的基于硅铝异质结构的MEMS压力传感器及带有恒温控制和自校正功能的配套测量系统可以一定程度上解决这些问题。首先,理论分析了硅铝异质结构的压阻放大效应,将掺杂硅压阻条宽度优化设计为20μm,采用SOI硅片为原料设计了一种带有两对应力敏感和
随着立体成像技术的日益流行,3D高清影像产业不断发展,人们对于图像清晰度及视觉效果的要求越来越高。但是在3D图像的获取、传输、恢复和存储的过程中,会引入不同类型和程度的失真,从而造成立体图像质量下降,给人们理解和利用图像信息带来影响。因此立体图像质量评价的研究变得越来越重要,立体图像质量评价也是评价立体成像系统性能的一种有效方法。与2D图像相比,3D图像的每个视图不仅遭受2D图像会产生的单目失真,
热带气旋(Tropical Cyclone,TC)是发生在热带亚热带地区洋面上的一种暖心气旋式涡旋,是一种强大而深厚的热带灾害性天气系统。热带气旋强度被定义为热带气旋近中心附近最大持续风,准确估算热带气旋强度是热带气旋预报和灾害预警的关键。德沃夏克技术(Dvorak)被广泛应用于热带气旋定强,深度学习在热带气旋强度估计也表现出了与Dvorak相当的水平。除了Dvorak技术及改进版本仍然存在热带气
随着互联网技术和计算机技术的发展,以视频形式存储的数据已经成为了信息传播的主要载体之一,视频所包含的信息相比于图像更加丰富,更具表现力和渲染力,其中不仅包含静态的空间信息,还有大量随时间变化的运动信息。所以,视频数据的处理和分析是一个很重要的研究领域,本文所研究的视频目标分割是其中的一个重要研究方向。视频目标分割是指需要人为预先指定待分割目标(通常是给出视频序列的第一帧的分割掩码),然后依据首帧掩
随着治理荒漠化政策逐渐推行,预测沙尘暴和降低沙尘暴天气所带来的损失成为气象和生态环境领域的重要研究课题。沙尘暴天气下风速和空气中沙尘浓度升高,增大了超声波的衰减程度以及回波信号的识别难度,风速风向测量的误差也随之增大,所以提高超声波风速传感器在沙尘暴中的测量精度对预测和治理沙尘暴具有重要的研究意义。本文针对风沙影响下提高超声波风速传感器的回波强度和测量精度进行了研究,具体内容如下:首先,采用COM
超宽带穿墙探测技术利用其频率低与宽带大的优点,能够对树木、浓烟、混凝土墙等隐蔽物后方进行目标识别与成像,与传统窄带雷达探测相比,由于其穿透性好、距离向分辨率高、抗干扰性强,近几年来在军、民应用方面得到进一步发展。在穿墙雷达探测中,电磁波穿透墙体障碍物时会产生折射、反射与能量衰减,且电磁波在不同墙体介质中传播速度不同,因而成像时会出现目标不存在、偏移、失焦或散焦等情况。此外,BP等传统成像算法对探测
随着全球的通信业务的迅猛发展,各类业务对带宽的需求日益增加,因此,拓宽带宽成为电子信息产业发展的重中之重。天线作为信息工业必不可缺的重要组成部分,整体的设计要求也在向小型化,高集成化方向发展。此外,为了满足人们的更多需求,圆极化天线开始受到青睐,圆极化波在抗多径干扰,减少极化失配等方面有显著优势,且已广泛应用于卫星通信和军事通信领域。但单独的微带天线单元增益低,带宽窄,人们为了追求更高的增益,实现
NFC技术是一种新兴的通信技术,它主要用于短距离无线信号传输,NFC天线是射频识别技术中常用的天线,工作频率为13.56MHz,该天线与射频电路结合起来,可以收发射频电路芯片中存储的信息。随着现代生物医疗的发展,NFC技术也逐渐使用到医疗可穿戴设备当中,这就要求天线能够具有较好的稳定性,才能准确地读取数据。本文提出了一种双层NFC天线与传统单层NFC天线进行比较,判断两者的稳定性;同时还研究了NF
脉冲多普勒雷达是一种基于运动体多普勒效应探测运动目标距离和相对运动速度的全相参体制雷达。论文首先介绍并研究脉冲多普勒雷达基本信号处理流程,重点是数字下变频模块和脉冲压缩模块的设计技术。针对数字下变频模块,基于带通采样特性,设计了时序控制抽取模块,对中频回波直接抽取,形成I/Q两路正交中频回波,大大减少板上资源占用量。针对脉冲压缩后高距离旁瓣问题,对比分析国内外现有方法,研究提出了一种用于加权的新的
无线通信技术的迅猛发展驱动着移动通信和互联网的结合,并取得了长足的发展与进步,面对未来通信场景中数据流量的增长、海量的终端设备、各类新型场景业务的层出不穷以及超高数据传输速率等需求,第四代移动通信系统已经无法满足。大规模多输入多输出(Multiple Input Multiple Output,MIMO)技术能够在不增加带宽的前提条件下以具备提高传输速率,增加系统容量和提升频谱效率的特点成为了未来