基于Transformer的单通道语音增强研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:l_zhijie1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强目的是消除信号中的噪声成分,以提高语音听觉质量和可懂度。语音增强广泛应用于移动通信、医疗、军事、监控等领域;语音增强技术还可以用作语音识别系统的前端,通过对语音信号进行降噪,提高语音识别能力。本文针对基于Transformer的语音增强技术展开研究,具体工作如下:首先,提出了一种结合加权残差机制的ZTrans语音增强方法。该方法通过Transformer模型利用语音帧之间的相关性进行建模,并在模型中引入了加权残差机制,并行地对整个序列进行注意力计算以提高模型训练速度。实验结果表明,基于该方法增强后的语音具有较好的听觉质量。其次,针对语音频谱分量的相位部分没有明显的结构,很难直接作为监督学习的对象,本文提出一种基于复数谱映射的Complex-ZTrans模型的语音增强方法,该方法通过对语音复数谱的实分量和虚分量进行预测,间接实现语音相位增强。实验结果表明,考虑了相位信息的Complex-ZTrans语音增强方法获得了比ZTrans语音增强方法更好的增强后语音。
其他文献
伴随着我国经济社会的高速发展和城市化进程的快速推进,城市绿化需求旺盛。加之我国先后启动了“国家园林城市”、“国家森林城市”评定程序,推动了园林绿化行业快速发展,各地园林绿化企业和工程如雨后春笋般涌现。然而,在城市园林建设对绿化质量要求越来越高的同时,科学合理的质量评价体系和评价方法却没有适时地建立起来。园林绿化工程数量与日俱增而缺乏精品工程,大部分绿化工程的质量达不到理想的绿化效果。目前,国内有关
学位
钓鱼攻击已成为人们日常网络环境面临的重大威胁。钓鱼攻击者伪装可信网站骗取用户信任,窃取用户敏感数据,使得用户造成损失。因此,需要一种有效的方法来防止网络钓鱼攻击对人们造成持续的损失。网络钓鱼检测系统广泛应用机器学习模型对海量钓鱼数据集进行分类。基于经验,研究人员倾向于提取尽可能多的特征来提高网络钓鱼检测性能。然而,特征集中的冗余特征和无用特征会降低底层分类模型的性能。与此同时,现有的钓鱼检测模型大
学位
陀思妥耶夫斯基是享誉世界的俄罗斯文学巨匠,其作品意义深刻,写作手法高超,具有极高的艺术研究价值,众所周知,陀思妥耶夫斯基的作品并不是浅显易懂的,需要认真琢磨才能发现越来越多的精彩之处,因此在分析作家作品的艺术手法上,更应该注意一些细节描写,通过对细节方面的解读有助于读者更深的感悟作家卓越的写作能力和作家想要表达的思想内容,探索更多的文学性意义。作家是茶叶的狂热爱好者,其文章中多处使用了与茶叶有关的
学位
学位
2016年我国正式拉开特色小镇培育的序幕,国家各部委连续出台相应的支持政策,同时各省也紧随国家大政方针的步伐,纷纷开展特色小镇培育工作。特色小镇在推进新型城镇建设、缩小城镇发展差距、打造乡镇经济增长极、促进产业升级和转型、创造乡村就业岗位、提升乡村劳动力素质、激发乡村发展潜力、培育县域经济绿色发展路径具有重要的战略意义。近年来,我国特色小镇的数量和投资规模在不断提升。但同时,特色小镇的发展状况也存
学位
就工笔花鸟画的创作而言,禽鸟造型的人格化表现对画家抒情写意有着重要价值。本文以工笔花鸟画作品中禽鸟造型的人格化表现为契入点,从作品中的人格化表现等角度着手,结合本人的毕业创作,梳理禽鸟造型的人格化表现对于工笔花鸟画创作的意义。本文分五章:首先从选题意义入手,介绍选题的研究现状、研究思路、研究方法和创新之处。第一章,人格化表现与艺术创作,就人格与人格化表现的概念进行界定,从物象拟人化的角度论述形体、
学位
缺乏创新才能是中国社会发展的最大障碍。21世纪被国际教育界称为“创新教育”世纪,教育如何适应时代的发展,积极寻求自身的发展,以适应培养创新人才的目标,是“创新教育”研究的重点。而幼儿园作为教育的基础时期,在这一阶段对幼儿展开美术教育十分重要,幼儿教师要能结合多种有效的授课方法,在美术教育活动中发展幼儿的创新创造意识和动手能力,结合幼儿的身心特点寻求有效提高幼儿创造能力的策略,为幼儿以后的学习和成长
期刊
上个世纪的中国画坛,由于受到国内社会的变革及西方艺术思潮的影响,引发了艺术观念和创作方面前所未有的变革。因受时代精神的感召,一批富有社会责任感且锐意进取的画家们深刻意识到,惟有对传统中国画做较合乎时代的革新,才能体现出画家的艺术担当。因此,画家们在新时代的社会环境下进行创作时,始终坚持着勤于思考,勇于实践,敢于革新的创作精神。同时,他们也在积极探索着中国画在新的历史时期中所承载的新要求、新任务、新
学位
时频分析在信号处理领域有着不可或缺的作用,时间与频率的联合分布能够直观显示信号的频率随时间变化的特性,对于实际应用中常见的非平稳信号的分析处理比纯粹的时域分析或者频域分析更加合理有效。主流的时频分析方法大致可以分为线性、双线性以及参数化时频分析,其中双线性时频分析易受交叉干扰项影响,参数化时频分析尽管可以消除交叉干扰项,但求取基函数模型参数的计算复杂度较高。相比之下,线性时频分析不仅没有交叉干扰项
学位
随着我国电力系统建设逐渐完善,在电力监测中所应用的新技术和新设备不断增加,其中电力线不仅为用电设备供给电能,同时属于信息数据通信系统。高效、可靠传输数据信息属于通信网络基本要求。而电力载波通信中存在大量的干扰因素对信息传输效率和质量产生影响。本文对载波通信阻抗特性、衰减特性、干扰特性分析研究,并由物理层信号处理、数据链路层数据传输层面分析,对抑制技术应用可行性进行分析,探索有效抑制脉冲干扰技术。
期刊