基于深度学习的音频啸叫处理方法研究

来源 :广州大学 | 被引量 : 0次 | 上传用户:nurgul2120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在使用扩声系统的封闭室内,由于麦克风和扬声器同处于一个环境中,导致声反馈的存在,严重时会产生啸叫。刺耳的啸叫会影响听感和破坏扩声系统的元器件,造成系统损坏。现有的啸叫抑制方法主要有相位调制法(PM),增益控制法和自适应声反馈消除法(AFC)。相位调制法和增益控制法根据其实现原理会破坏信号的幅值和相位,自适应声反馈消除法受限于自适应算法的性能,存在稳态误差并且需要加入去相关技术减少信号之间的相关性,这些方法会造成声音质量的下降。为了解决啸叫问题,本文提出使用深度学习的方法来研究啸叫抑制问题,通过建立一个有监督的神经网络完成从输入啸叫信号到输出干净信号的映射,以此估计并消除输入信号中的啸叫反馈分量达到啸叫抑制的目的,并尽量减少声音信号的失真。本文对语音和音频信号使用不同的技术进行研究,包括输入特征,学习模型(神经网络结构),激活函数和优化算法,通过实验结果从中找到了比较合适的组合来构成本文提出的方法,并提高了语音信号的语音质量(PESQ)和语音可懂度(STOI),对音频信号提高了信号的信噪比(SNR)。本文还与频域自适应算法进行对比,自适应算法存在收敛和稳态误差问题,而深度学习通过大量数据的不断学习,减少输出信号和期望信号的误差,预测时直接输出预测结果,能消除收敛过程中的信号失真。对比实验结果显示了本文的方法处理啸叫信号后对语音质量和可懂度的提升都要高于频域自适应算法处理的结果,而且从时频图上看,本文的方法明显消除了啸叫特征,验证了方案的可行性和有效性。本文提出的方法在声音质量上还有提升空间,后续可以使用符合人耳听觉特性的特征进行研究,如梅尔倒谱系数(MFCC)等,而且时频信号在重构时会产生误差,建立时域的神经网络也是一个研究方向。
其他文献
随着城市化的持续推进,人口、资源等要素不断往城市群和都市圈集聚,城市越来越成为一个精密、庞大而复杂的个体。伴随着城市化水平的提高,城市所面临的内外部风险也日渐扩大,这些风险常常难以预测且无法避免。如何应对不确定性冲击,成为城市发展的新议题。在此背景下,强调“耐灾”能力的韧性城市提供了新的发展思路。城市基础设施是城市的骨架,也是风险来临时最主要的承载体,城市基础设施的韧性是城市韧性的重要组成部分。其
近年来,我国逐渐推进城镇化建设,进一步加快了建筑工业化的脚步,建筑产业在高速发展中。在可持续发展战略的今天,为了减少传统的建造方式中产生的能源消耗,改变传统的管理方式,减轻环境污染,建筑行业必然迎来全新的转型升级,装配式建筑已经成为必然趋势。装配式建筑很少对环境造成污染,充分利用资源,提高施工效率,是实现转型升级的重要保证。新型的建筑工业化是对传统建筑形式的变革,其显著特点是标准化设计、工厂化生产
集成电路是电子及电气系统的基础和核心,其应用涉及到当今人类社会的方方面面。数模混合集成电路是集成电路家族中的一个重要分支,具有综合性较强、覆盖面较广、诊断复杂的特点。检测和诊断是确保集成电路功能、性能正确的重要手段。本文开展对数模混合集成电路诊断方法学的研究具有重要的科学意义和应用价值。本文基于BP神经网络算法,提出了一种数模混合集成电路诊断方法,以集成电路中温度采集功能模块的电路为载体验证了所设
改革开放40多年来,我国制造业总量增长势头显著,制造业也从提供基本加工服务向自主研发跨进。截至目前,在中美贸易冲突与疫情影响下,我国仍保持着制造业总量第一,高端技术制造业增速快与高端制造出口、装备制造业比重上升等好成绩。这是多年来我国以制造业强国为发展目标,顶层设计与基层活力相结合、政府作用与市场机制相协调、比较优势与能力建设相匹配、技术引进与自主创新相呼应、国内市场与国外市场相联动等因素所共同形
抽动症属于行为障碍疾病的范畴,属于神经椎体外系功能缺陷,多发生在儿童群体,大多起病于3~12岁。而春季是抽动症的易发时节,这是因为春季万物复苏,人的大脑神经细胞相对活跃,对外界刺激比较敏感,故容易诱发抽动症和多动症。抽动症与行为怪异有本质区别有的家长发现孩子行为有“异”,不知如何判断孩子只是调皮、好动或扮怪象,还是患上了抽动症?其实,这很好区分,如果只是孩子行为怪异,则是可控的,是能自主停得
期刊
自从EPC工程总承包模式进入我国建筑工程领域后,它就得到了政府的大力推广与支持。由于EPC总承包模式具有管理成本低、资源占用低、便于控制工程造价、提升企业履约能力等优势特点,所以,经过数十年的发展,我国已形成了一大批EPC工程总承包企业,进而确定了 EPC总承包模式在我国建筑工程领域的主导地位。截止目前,我国建筑工程领域已经形成了以总承包企业为核心、以专业分包商为骨架、以劳务公司为基础的建筑工程项
氮化镓系材料是重要的第三代半导体材料,以其优良的性能广泛应用于航空航天、国防军工、生活消费当中。InAlN/GaN异质结构是应用于高效、高频、大功率器件的核心结构,而InAlN/GaN异质结构的核心却是2DEG(TwoDimensional Electron Gas)。本文系统介绍了氮化镓系材料与异质结构的性质、原理、应用,在理论上详细分析了InAlN/GaN异质结构中2DEG的特征。1、氮化镓的
随着我国建设项目的建设规模、技术复杂程度和投资总额不断增大,委托方对工程咨询服务也提出了更细和更高的要求。传统工程咨询提供的分阶段、碎片化服务很难满足业主的要求,也无法满足国家供给侧结构性改革的需求。在这种背景下,近年来,国家为全过程工程咨询的发展提供了众多机遇,明确鼓励投资咨询、设计、监理、造价等企业向全过程工程咨询发展,提供综合性的、全过程的工程咨询服务,然而现阶段全过程工程咨询存在整体性服务
空气质量问题影响我国经济的发展态势,如果空气污染严重,那么政府需要将一部分财政支出投入到环境污染治理上来,会加重财政负担,而且影响居民的消费结构,同时对人们的身心健康造成严重的危害。据统计,在我国,近乎有百分之五十的人口生活在空气质量低于WHO规定的安全标准的环境中,由此可见,治理空气污染迫在眉睫。在财政上升为“国家治理的基础和重要支柱”的时代背景下,运用财政手段引导地方政府治理空气污染,是一个不
在核动力装置运行过程中,为了保证装置的安全、高效运行,往往需要对气液两相混合物进行分离。传统的气液分离设备主要适用于对处于单一、稳定流型下气液混合物的分离,而无法满足对处于多流型下、特别是不稳定流型下气液混合物进行高效分离的要求。因此研发一种适用于对处于多流型下、特别是不稳定流型下气液混合物进行高效分离的新型气液分离器具有重要意义。本论文以空气和水为工质,在专门搭建的气液分离实验回路上开展了一系列