基于特征变换融合与注意力机制的发音反演研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:kinglesssss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
发音反演是根据语音信号反推发音器官运动的一种研究,在语言学习、康复指导等方面有着巨大应用价值。目前的发音反演研究只使用音频语音特征作为输入,不可避免地造成了一定的性能瓶颈。且近年来在反演框架方面也进展不多,以双向循环神经网络为主要方法。为了解决上述问题,本文提出一种新的基于辅助特征融合的网络(Auxiliary Feature Fusion Network,AFFN)来实现舌位的发音反演。本文主要研究了发音反演的特征处理和反演网络两方面。在输入特征上,本文将EMA数据集中的非舌部位置的运动轨迹作为辅助特征与语音特征一起提升输入特征上的多样性。在验证了所提出的辅助特征的有效性后,为了进行反演网络的改进,因此在保持输入只有语音特征的前提下,采用提取模块来预测辅助特征。同时借鉴基于典型相关分析的特征融合思想,我们提出了一个特征变换模块来生成一个具有较高相关性的联合特征作为反演模块的输入。最后,使用带注意力机制的编码器-解码器网络代替一般的多层LSTM网络,进一步增强上下文相关性。通过在公开数据集mngu0和MOCHA上进行说话人相关的发音反演实验,验证了特征变换融合和注意力机制对反演结果的有效性。最终的结果表明,本文所提出的基于特征融合与注意力机制的发音反演模型在不改变输入特征的情况下能够大大提升系统的反演性能,在各数据集上与现存的最佳方法相比误差均下降了15%以上。
其他文献
近年来,随着半导体集成电路(IC)产业的快速发展,微纳加工技术受到了前所未有的关注。作为一项十分关键的微纳加工技术,反应离子刻蚀(RIE)由于具有较高的刻蚀速率和优良的刻蚀各向异性,在IC制造业中起着至关重要的作用。由于刻蚀工艺参数之间相互依赖,相互影响,共同决定了反应离子刻蚀的刻蚀速率及刻蚀形貌。因此,探明刻蚀工艺参数之间的相互关系,对于刻蚀具有垂直侧壁的沟槽形貌,获得最佳刻蚀工艺参数至关重要。
超短脉冲激光拥有极窄的时域宽度、较宽的光谱与极高的峰值功率,在物理、化学及生物学领域的超快过程研究中发挥着重要作用,同时作为高端制造技术在工业领域的应用也越来越广泛。相较于采用其他介质材料的激光器,光纤激光器具有良好的光束质量与更高的集成度,且易于维护,成为了一种重要的飞秒激光技术。在光纤飞秒激光器的研究中,光纤锁模技术是保证飞秒激光系统稳定工作的关键,也是目前飞秒激光技术研究的重点之一。本论文主
井间瞬变电磁勘探是在一口井中放置发射线圈,在另外的井中放置阵列接收线圈。控制发射线圈中电流的通、断在地层中激发瞬变电磁场,利用接收线圈响应识别地层电学参数分布,因此需要研究线圈激发的瞬变电磁响应波形和分布。本文从Maxwell方程出发推导了一维瞬变电磁场响应——既衰减又相移,相移折算的扩散速度随频率变化而改变,应用传递矩阵方法计算了一维三层介质中的反射和透射波形。利用线圈在无限大均匀介质激发响应的
振荡现象在自然界中普遍存在,现代神经科学研究表明人类大脑计算就是通过振荡进行的。近年来,以忆阻器为基础的人工神经网络在类脑研究中得到了广泛关注。随着半导体制备技术的发展,纳米级、低功耗和高度可集成的振荡器已经可以实现,为模仿人脑计算奠定了硬件基础。易失性忆阻器在电流-电压曲线上呈现出S型负微分电阻(S-NDR)现象,也叫阈值开关,可以用来制备纳米振荡器。研究负微分电阻的起源对挖掘易失性忆阻器的潜在
随着集成电路工艺尺寸不断的缩小和产业化进程的加快,对芯片的测试要求也越来越高,可测试性设计(Design for Test,DFT)已成为芯片设计中必不可少的一环。扫描测试作为芯片可测试性设计的主要实现方式,对其设计方法的研究显得非常重要,在芯片规模较大时,测试压缩也是扫描测试中需要考虑的重要因素。本文基于一款微处理器(Micro Processor Unit,MPU)芯片子系统模块的扫描测试设计
气敏材料的性质决定气敏传感器的性能。ZnSnO3是一种具有良好气敏性能的三元化合物半导体材料。但是,纯ZnSnO3气敏传感器的工作温度通常在200℃以上,这极大地限制了它的应用。因此,如何降低ZnSnO3气敏传感器的工作温度并使其具有良好的气敏性能,成为本领域研究的热点。通过ZnSn(OH)6高温脱水制备ZnSnO3,是获得这种敏感材料的途径之一,且其性能会受形貌和粒径等微结构的影响。在ZnSn(
嗅觉作为生物进化史上最古老的感官功能,与人类的记忆、学习和情绪等密切相关。大脑皮层是最高级的神经中枢,能够评估来自各器官的刺激。研究大脑对不同气味的识别能力在嗅觉功能障碍的评估与诊断、抑郁症等精神类疾病患者的情绪调控等方面具有重要的意义。近年来基于脑电(Electroencephalogram,EEG)信号的嗅觉研究逐渐受到各国学者的关注。现有的基于EEG信号的气味种类识别研究往往只采用单一特征,
封装界面连接层作为电子封装结构中的一个薄弱环节,经常受到电、热和机械等复杂载荷。连接层的疲劳被认为是功率模块封装结构的主要失效模式。鉴于纳米银焊膏具有熔点高(961℃)、热导率高、弹性模量低等特点,适用于高温大功率电子封装界面互连。本文提出了一种绝缘栅双极性晶体管(IGBT)模块的可靠性增强的优化封装方法。区别于目前主流商用封装策略,本课题采用电流辅助烧结纳米银焊膏作为芯片连接层,进而使用高熔点焊
纳米银焊膏凭借其优异的机械、热、电性能,以及简易的烧结工艺等特点,已成为功率半导体器件封装中极具前景的芯片互连材料。然而,银极易发生电化学迁移,导致电子元器件短路失效。随着宽禁带半导体在高温应用和高密度封装的发展,迁移的风险将大大增加。以往集中于常温湿气环境下改善银迁移的机制和方法将不再适用,这对高密度封装的可靠性提出了挑战。有研究学者提出向纳米银焊膏中添加钯粒子来改善银的电化学迁移行为,但其电化
Au/Ni/Cu是一种常用的PCB焊盘表面镀层。在回流焊接过程中,Au层迅速溶解于钎料,Ni层为焊盘与焊球实际的连接层,其厚度显著影响焊点内微观组织的形成及演化,进而影响焊点力学性能。本课题通过研究具有两种Ni镀层厚度(一组Ni镀层厚3μm,标记为S1;另一组Ni镀层厚6μm,标记为S2)的Sn3.0Ag0.5Cu/Au/Ni/Cu焊点的微观组织演化及力学性能,澄清了焊点中Au-Sn化合物及界面I