基于生成对抗网络的端到端骨导语音增强方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:hefang1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动通信的高速发展,嘈杂环境下的语音交流问题已经变成一个迫切需要解决的问题,如何有效的去除背景噪声对语音通信的影响,日益受到人们的广泛关注。骨导语音技术提供了另外一种抗噪的思路,骨导语音通过人体传导声音振动,最后通过高度灵敏的传感器收集信号。正是由于这种特殊的传导性质,骨导语音不会被空气中的噪声所干扰,能够一定程度的消除噪声影响。但是人体传导和空气传导语音有着不一样的性质,因此骨导语音和气导语音存在着一定的声学差异,骨导语音的高频信息缺损严重,导致骨导语音的听感不佳,清晰程度和辨识程度不高,严重影响在抗噪方面的应用。为了解决骨导语音质量问题,本文提出一种基于生成对抗网络的端到端骨导语音增强方法,它以骨导语音波形为网络输入,输出增强后语音波形,这种端到端模型的增强能够更好利用语音信号的内部信息,去除复杂的特征提取和特征合成语音过程。生成器采取卷积编解码架构,使用多个空洞卷积操作对网络编码的结果进行不同尺度的特征提取、再进行融合,获得了表现力更强的特征描述。为了进一步提高增强结果,还针对性的对网络损失函数作了一定的改进,通过对抗的训练方式提高学习能力和骨导语音增强能力。实验结果表明,该方法和其他的增强算法相比,具有较高的语音感知质量和可懂度,并且还采取了ASR识别率作为语音的评估指标,识别率的提升进一步证实了算法的有效性。
其他文献
随着无线访问接入点AP(Access Point)在室内环境中的大量部署和应用,利用WiFi进行室内定位的技术成为研究热点。近年来,室内定位技术已有很多优秀的研究成果,但是能够在真实大规模场景中部署应用的却很少。这是由于利用WiFi定位需要在参考点上采集大量带有位置信息的WiFi信号强度(RSS,Received Signal Strength)指纹数据来构成指纹库。这些指纹数据通常由专业人员采集
随着单模光纤通信容量不断的逼近非线性香农极限,人们迫切的需要开发新的维度来拓展通信容量。基于少模光纤的空分复用技术因能充分利用光纤中的空间维度而备受关注。但在少模光纤应用于光纤通信系统的过程中,需要充分考虑非线性效应对少模光纤的影响。因此本文对光纤中的非线性效应进行了研究,并重点研究了少模光纤模间四波混频的频谱关联特性。本文主要工作包括以下三个部分:一、对少模光纤参数与少模光纤特性进行了仿真研究。
当今的说话人识别任务往往局限于使用传统的特征提取方法而忽略了说话人个性化特征的产生机理。一些广泛用于语音识别的特征被直接应用在说话人识别任务中,但这两种任务在某种程度上存在对立性,尽管大多数特征在实际应用中可以取得较好的识别结果,却没有明确合理的解释。特征提取器是说话人识别系统的首个组成部分,其在一定程度上决定了之后分类模型的性能,一个好的特征需要包含能够强调说话人个性化特性的部分。为此,本文聚焦
网络功能虚拟化(Network Function Virtualization,简称NFV)和移动边缘计算(Mobile Edge Computing,简称MEC)是第五代移动通信网络技术中最核心的两大技术,因此,在移动边缘网络环境中部署服务功能链(Service Function Chain Allocation,简称SFC-A)在提高用户的体验质量(Quality of Experience,
近年来,鲁棒的声音识别受到国内外研究者们越来越多的关注。现实环境中,噪声无处不在。如何在真实的噪声环境下鲁棒地识别一个突发声音仍然是一个具有挑战性的任务。而在声音识别中,需要解决的最主要的两个问题就是特征提取和分类器模型选择。本研究的目的是为了探究有效的、切实可行的特征提取和模型选择方法来进一步提升声音识别的鲁棒性。类脑计算是一种更加接近于人类大脑的信息处理方法,本研究我们探究采用类脑计算的方法来
蓝牙低功耗技术作为物联网的基础构件,成为智能应用不可或缺的无线连接方式,被广泛应用在无线个人局域网中。根据蓝牙技术标准规范,低功耗安全简易配对(Low energy secure simple pairing,简称LESSP)协议是配对设备协商认证密钥的过程,旨在为用户提供安全、隐私、低功耗的无线配对方式。大规模监控的实质是算法替代攻击(Algorithm-substitution attack,
强对流天气作为一种具有极大破坏力的气候类型,对我国经济、农业及民生等方面产生了恶劣的影响。多普勒天气雷达是监测和预警强对流天气的重要工具之一,具有分辨率高、产品丰富等优点。为了提升效率,减少非对流单体部分带来的影响,对传统预报方法进行改进。针对具体对流单体进行分析,帮助气象研究人员实现强对流天气监测和预警。为有效完成对流单体的识别、跟踪和预报工作,本文基于多普勒天气雷达基数据,提出了一种基于雷达反
随着阵列天线的应用和发展,阵列信号处理已经成为现代信号处理领域的重要分支。相控阵雷达具有准确的波束指向能力,通过在每个阵元的输出端接入移相器来控制相控阵的波束方向,具有角度依赖特性,在目标的参数检测估计与成像等领域被广泛应用。频控阵雷达既可以同时改变相位和频率,也可以只改变其发射频率,可以使同一快拍时间内的发射波束不再指向固定的角度,具有角度距离依赖特性和空间波束自动扫描特性,可以实现距离依赖性干
近年来,随着人工智能的发展,各种高新技术不断涌现,室内定位技术也变得越来越成熟,得到了大范围的应用和推广,同时给人们的生活带来了方便,也给社会创造了财富。但是WiFi信号在传播过程中,很容易受到障碍物的干扰,并且信号波动大,从而导致定位的准确度不高。为了克服这些问题,本文基于WiFi2.4G和5G双频段信号,使用SVM算法对NLOS状态进行判别以及胶囊神经网络等方法来减少环境因素的影响,提高定位精
立体显示技术已在多个领域得到了广泛的应用,为人类的日常生活工作带来很多惊喜与便利,但是长时间观看立体影像会引发观看不适,该缺点限制了立体显示技术的发展。立体深度运动是影响视觉舒适度的重要因素之一,对立体深度匀变速运动的认知和识别研究具有重要的理论意义。本文提出一种能够自适应提取脑电特征的PMEMD–2JSD–CSP模型,实现了两类立体深度匀加速运动脑电信号的分类识别。该算法首先利用部分噪声辅助多变