【摘 要】
:
随着信息技术的快速发展,视频直播、语音聊天等与“声音”有关的社交方式越来越受欢迎,而语音通信质量也愈发受到人们的关注和重视。在进行语音通信的过程中,语音总是会受到各种背景噪声的干扰,导致语音通信的质量下降进而使得很多语音处理系统的性能受到严重影响。为了有效改善系统的性能,提高语音通信质量,语音增强技术开始被广泛研究。残差神经网络作为一种新兴的深度神经网络,在原有的神经网络的基础上通过使用“跳跃连接
论文部分内容阅读
随着信息技术的快速发展,视频直播、语音聊天等与“声音”有关的社交方式越来越受欢迎,而语音通信质量也愈发受到人们的关注和重视。在进行语音通信的过程中,语音总是会受到各种背景噪声的干扰,导致语音通信的质量下降进而使得很多语音处理系统的性能受到严重影响。为了有效改善系统的性能,提高语音通信质量,语音增强技术开始被广泛研究。残差神经网络作为一种新兴的深度神经网络,在原有的神经网络的基础上通过使用“跳跃连接”引入残差模块,缓解了在深度神经网络中增加深度带来的梯度消失问题。目前,残差神经网络在图像分类和物体识别中已经取得了良好的效果。因此,本文将残差神经网络应用于语音增强技术中。目前大多数语音增强技术都是将变换域的音频特征作为神经网络的输入,这不仅需要进行信号转换,而且通常会忽略相位信息。因此,本文选择将语音信号的原始波形作为残差神经网络的输入,实现端到端(即原始波形输入和原始波形输出)的语音增强技术。本文的主要研究工作包含以下几个方面:1、提出了一种基于残差神经网络的端到端单通道语音增强方法。现存的大多数语音增强方法都是在变换域进行的,通过傅里叶变换等操作对语音信号进行特征提取。但是,此过程可能会破坏语音信号的高频部分和时域相关性信息。因此,本文选择直接对时域原始波形进行处理,实现端到端的单通道语音增强。实验结果表明,所提算法能够有效抑制噪声,提高了语音质量。2、麦克风阵列在智能化设备中有着广泛的应用,为了改善麦克风阵列的降噪性能,本文针对多通道语音增强技术进行了研究,提出一种基于最小方差无失真响应(Minimum Variance Distortionless Response,MVDR)波束形成器和后置滤波的多通道语音增强方法。该方法首先构建了基于复频域掩蔽的MVDR波束形成器,其次,将所提出的端到端单通道语音增强技术作为其后置滤波器,进一步抑制波束形成输出端的残余噪声,最终有效改善了语音增强的效果。3、为了验证所提出的基于残差神经网络的端到端单通道语音增强算法的泛化能力和实用性,本文首先利用该技术对从不同生活场景中采集到的噪声进行抑制,并通过不同的客观质量评价方法衡量技术的性能。其次,本文将该技术应用于Speex编解码器,作为其前端语音增强模块,改善语音通信的质量。
其他文献
本文对2009-2015年在创业板上市的公司进行实证分析,研究企业公开发行前的私募股权投资持股行为对发行后企业价值的影响。根据认证理论、筛选理论、监督理论、市场力量理论等
焊剂片约束电弧的方法在超窄间隙焊接中具有明显的优势。采用焊剂片约束电弧的焊接方法时,焊接坡口间隙宽度仅为4 mm,焊接热输入低,只有0.5 KJ/mm,能够降低焊后残余变形和残
多模型方法由于能够处理有着较大工作范围以及较大工况变化的强非线性工业对象的控制问题,因而受到了越来越多的关注。多模型方法有两大核心问题,即分解与合成。在多模型合成
研究目的肿瘤微环境(tumor microenvironment,TME)中存在着很多免疫分子,对肿瘤发生、侵袭、转移具有不同的作用。三阴性乳腺癌(triple negative breast cancer,TNBC)由于其缺乏有效的治疗靶点,因而预后相较于其他乳腺癌类型更差,而免疫治疗是目前具有巨大潜力的治疗方式。因此,探明三阴性乳腺癌肿瘤微环境中各个免疫分子之间的相互作用及其作用机制十分必要。
从安徽铜陵酸性矿山环境中采集酸矿水和底泥样品,采用FeT、FeS、Waksman、Starky四种选择性培养基,从酸矿水中分离纯化出一株硫氧化菌W-3-1。对W-3-1进行系统生物学鉴定,结果
甲基乙二醛(Methylglyoxal,MG)是一种细胞毒素代谢副产物,广泛产生于糖、氨基酸、丙酮等代谢过程。它可通过蛋白质的糖基化修饰和不可逆交联影响蛋白、核酸、脂质分子的结构和
目的:比较腹腔镜开窗术(laparoscopic fenestration,LF)与开腹开窗术(open fenestration,OF)在肝囊肿手术中的疗效,为临床肝囊肿的治疗提供更多可靠依据。方法:通过计算机系
20世纪90年代至今,中外合作办学历经多年快速发展,已经成为我国教育交流合作的重要形式。合作的意义在于牵手世界知名高校,引进国外优质教学资源,让学生能够体验原汁原味的国
在使用无线射频识别(Radio Frequency Identification,RFID)技术的系统中,多个标签同时向阅读器发送其自身信息时会造成它们之间的碰撞问题,增加标签识别时间、降低标签识别
在经济全球化背景下,我国资本市场在不断开放和发展,社会公众对上市公司内部控制缺陷信息披露的关注度也在逐步加强。上市公司内部控制缺陷信息的披露质量状况不仅反映了自身