【摘 要】
:
随着可穿戴设备、视频会议通讯、人机交互等各个领域的发展,语音增强技术受到了学者的广泛关注。传统时频域的语音增强算法存在估计噪声模型单一、抗干扰能力较差、语音增强效果较差的问题。尽管基于深度神经网络学习的语音增强方法可以改善上述问题,但因模型权重参数复杂,限制了其在嵌入式平台上的应用。针对上述问题,本文首先讨论了训练集中纯净语音信号与同频噪声信号的能量关系,提出了一种新的频带增益参数提取算法,对现有
【基金项目】
:
珠海市产学研合作项目:基于神经网络人工智能识别系统的研发(项目编号:ZH22017001200154PWC);
论文部分内容阅读
随着可穿戴设备、视频会议通讯、人机交互等各个领域的发展,语音增强技术受到了学者的广泛关注。传统时频域的语音增强算法存在估计噪声模型单一、抗干扰能力较差、语音增强效果较差的问题。尽管基于深度神经网络学习的语音增强方法可以改善上述问题,但因模型权重参数复杂,限制了其在嵌入式平台上的应用。针对上述问题,本文首先讨论了训练集中纯净语音信号与同频噪声信号的能量关系,提出了一种新的频带增益参数提取算法,对现有基于神经网络学习的语音增强算法进行优化改进。基于FPGA搭建应用测试平台,对所设计的语音增强算法进行了性能评估和应用示范:在特征参数提取过程中,采用能量谱深度调制算法提取训练集的频带增益参数,解决语音增强过程中出现过估计、少估计的问题;在语音增强模型训练过程中,针对算法模型复杂,计算速度慢的问题,提出了利用频带增益估算插值的数据处理方法,基于2层GRU循环神经网络进行模型训练,提高算法运行速度。为验证算法的有效性,对所提出的算法性能进行实验验证,并与现有文献中的算法在不同噪声环境下进行性能对比。结果表明,在Babble噪声干扰下,所提出算法的语音感知质量评价(PESQ)提高7.95%;在高斯白噪声干扰下,所提出算法的PESQ平均得分提高9.77%;在Factory噪声干扰下,所提出算法的PESQ平均得分提高7.19%;在Pink噪声干扰下,所提出算法的PESQ平均得分提高10.19%。最后,基于FPGA搭建算法测试平台,算法硬件实现后占用逻辑总资源的13.82%。
其他文献
二氧化硅(SiO2)微球作为一种常用的化妆品填充物,具有着流动性强、机械强度高、性质稳定等优点。工业中主要以正硅酸乙酯(TEOS)为原料来生产SiO2微球,更为廉价环保的水玻璃因其生产的微球团聚程度过高而并未得到广泛的应用。化妆品中常用的有机紫外吸收剂存在刺激皮肤、容易迁移等缺点,而无机紫外吸收剂则存在使用肤感差、遮盖力过高等缺陷。本论文以水玻璃为硅源合成出高分散的SiO2微球,随后对其进行表面改
中国特色社会主义进入新时代,人民生活水平不断提高,脱贫攻坚成为我党带领人民实现社会主义现代化、实现中华民族伟大复兴的首要任务。中国的脱贫工作成绩斐然,不仅帮助千家万户走出大山,还制定了一系列防止贫困户返贫的政策措施。而随着信息技术的发展,纪录片作为世界了解中国的窗口,作为新时代的网络宣传媒介,承载着大量形象的多模态信息,可以形象地向世界展示中国脱贫攻坚的磅礴力量,从而塑造中国的正面国家形象。由于脱
随着物联网的发展和5G网络的到来,越来越多的网络应用对于信息的时效性高度敏感。因此信息年龄作为一个新的性能指标被提出,用来衡量信息的新鲜度。而当前大部分关于信息更新的研究主要考虑了单源节点或无预算约束的信息更新问题。但在实际的场景中,多个源节点通常可以同时进行采样与更新操作,这些操作通常会消耗能源,因此源节点往往需要相应的报酬,而报酬的支付情况又受预算的约束。为了优化信息年龄,源节点应该频繁采样信
第七次全国人口普查数据显示,2020年广东省65岁及以上老年人口占比达8.58%,与第六次全国人口普查相比,上升了1.97个百分点。广东省老年人口规模增长明显,老龄化问题日渐突出。近年来,在中央的号召下,广东省开始推行以居家养老为代表的养老服务模式,该服务模式将老人在家养老需求与专业医疗护理服务有机地结合起来,成为当前解决广东省养老难题的关键举措。而随着广东省居家养老建设进程加快,老人对晚年生活提
近年来,电商平台纷纷在购物节期间进行游戏化营销实践,营造购物氛围,提高商品销量。在国内的电商平台中,淘宝平台最具代表性,并且淘宝的游戏化营销活动一直是用户的关注焦点,然而用户对淘宝的游戏化营销活动评价褒贬不一,有用户表示乐于参与淘宝的游戏化营销活动,但也有部分用户对淘宝的游戏化营销产生抵触心理,从而影响其对淘宝平台的持续使用。电商平台游戏化营销的研究还在起步阶段,不足以为电商平台通过游戏化营销改善
随着物联网技术的发展,传统工业网络发生巨大变革,并逐渐形成了工业物联网。工业物联网增强了机器之间的数据传输和数据处理能力,提高了生产制造的效率,为网络部署和资源调度等任务提供了极强的便利性。因此,工业物联网正在为迈入智能制造和工业4.0的进程赋能,带来一场新的技术革命。在这场技术革命里,充满了诸多机遇和挑战,其中包括了工业物联网中的数据时效性的挑战。在工业物联网中,对数据的实时传输以及远程监控质量
近年来,我国的脑卒中发病率越来越高,脑卒中患者术后一般会出现上肢功能障碍,表现为肌张力较大、痉挛和异常运动等等。大量的有目标的重复训练是非常有效的康复治疗方法,而外骨骼式机器人能够提供更有针对性的大量重复训练,提高康复效率。因此,研发上肢康复外骨骼具有重要的临床价值。目前在运动意图感知领域,常用惯性传感器、力传感器和生理信号传感器,而涉及到机器人的控制层面,形成了以力传感器为主的局面。然而,还存在
心智哲学视域下的翻译分形关系研究以心智哲学相关理论为理论框架,探究原文与译文之间分形关系的形成;通过探究在翻译过程中影响译者心智选择和言语表征行为的缘由,揭示翻译分形关系生成的本质和规律,以期为翻译过程、翻译批评、认知翻译,尤其是译者行为研究供借鉴与参考。心智哲学认为,语言是心智的表征,语言活动即心智活动。在语言运用过程中,主体对同一事件的不同用例表征形式可归因于其对该事件所持有的即时心智差异。在
毕赤酵母是一种可以利用甲醇为唯一碳源进行生长代谢的甲基营养型酵母。甲醇在过氧化酶体中氧化成甲醛,经同化途径固定在胞内,或在细胞质中经异化途径完全氧化成CO2释放到胞外。本课题在毕赤酵母中构建了CRISPR Cas9系统,对异化途径的相关基因进行逐一敲除,比较了敲除菌与GS115在葡萄糖和甲醇培养下的表型、转录组和代谢组间差异,利用GO分析和KEGG通路分析,挖掘和解析了影响甲醇利用的相关基因和途径
物流信息平台作为实现司机和货主信息共享的基础设施,对司机与货主进行匹配是整合公路货运市场上的物流资源、提高物流运输效益的基础保证。物流信息平台能够通过车货匹配来减少货运因车、货信息混乱而导致的空载。与此同时,当前互联网技术与零售行业的融合进一步深化,衍生了一系列新的业态,如:新零售、生鲜电商等,提高了消费者对货物配送时间的敏感性。不少电子商务平台与物流信息平台开展合作,以求最小化配送时间。因此,如