基于发音运动连续性的语音修复的研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:gy19910192
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音复原效应(Phonemic Restoration Effect)是一种听觉感知现象,即在某些特定条件下,大脑会自动将缺失的语音进行恢复,使缺失的语音信号听上去似乎是完整的。这一现象反映了人在噪声等特殊环境下可以对缺失的语音信号进行修复的一种能力。目前对这一现象产生的原因,有两个公认的假设:一是基于各个发音器官的协同发音作用,即发音运动的连续性,二是基于上下文语义。这两个假设相互独立相互矛盾,但均未得到有力的证实。第一个假设中提到,人类在发出语音信号时,其发音器官,如嘴唇、舌头、下颌等,在协同发音的作用下,它们高度合作、相互制约,是无法自由地、骤然地运动的,而是有一条平滑而连续的运动轨迹。而人类的大脑即通过感知这种连续性,来对缺失的语音信号进行修复。为验证上面提到的第一个假设,本文提出了基于发音运动连续性的语音修复的框架。该框架的整体修复流程如下:对于有信号缺失的语音,将它输入到修复系统中,首先会对该信号进行端点检测,将现存的语音信号片段都检测出来;然后对这些语音信号进行相应的声学参数的提取,再利用发音运动与语音信号之间的双向映射模型,把它们映射成对应的发音运动特征;再将所得的发音运动特征按照时间的顺序连接起来,因为语音信号是是有缺失的,所以所得的发音运动特征自然也是有缺失的,而根据发音运动是连续的这一特点,可以利用插值等方法,将其缺失的部分进行补齐;最后再利用前面提到的双向映射模型,将补齐的发音运动特征映射成相应的声学特征,并合成语音填补到原来有缺失的语音信号中,这样即实现了语音的修复。为实现上述提到的语音修复框架,本研究首先建立了基于深度神经网络(Deep Neural Network,DNN)的语音信号与发音器官运动之间的双向映射模型,期间研究了不同的发音运动特征对于映射模型的影响,并根据具体问题,探究了最合适的发音运动参数、改进了传统的深度神经网络映射模型,提出了带有瓶颈特征的DNN层级结构模型;其次便是根据发音器官运动的连续性,利用三次样条插值(Cubic Spline Interpolation)的方法来对缺失的发音运动特征进行修复,进而实现对语音信号的修复。最后本研究从MNGU0数据库中选取了25句音频,手动对这些音频的语音信号的一部分做了替换,并利用该语音修复的框架对其进行修复。实验结果表明,本文提出的语音修复方法对于提高缺失语音信号的感知质量(Perceptual Evaluation of Speech Quality,PESQ)是十分有效的,并且在一定程度上验证了语音复原效应的第一个假设。
其他文献
我国高速公路交通安全形势严峻,重特大交通事故时有发生,交通安全问题凸显,应用车辆主动安全系统能够有效避免交通事故、降低伤亡人数、减轻致害程度。因此,根据交通事故发生前车辆行驶状态,运用高速公路交通事故调查和研究的数据,分析与评价车辆异常行驶风险源、子风险源及其风险致因,通过建立预警模型、选取预警指标和确定预警参数阈值,开发适用于低端车型改装的车辆异常行驶预警软件,并且搭建联合仿真平台验证其预警效果
现代工业监测过程中存在大量两相或多相流分布的问题,精确检测各相分布对于工业过程优化与控制有着重要意义,因此,过程层析成像技术近些年来迅速发展起来。然而,单一模态成像
电子商务法》的出台正式规定了电商平台经营者的责任,而对网络团购合同中的违约责任则没有明确规定,需要进一步探讨。网络团购合同涉及消费者、商家和团购网站这三方主体,团
基因剔除小鼠的技术体系是生命科学研究,尤其是人类基因组计划和医学实验动物模型等领域所急需的关健技术。基因剔除小鼠的建立是一项复杂的系统工程,本研究对基因剔除小鼠技
肝内胆管细胞癌是一种恶性程度极高的肝内肿瘤,发病率仅次于肝细胞癌位列肝脏恶性肿瘤第二位,近30年在我国发病率逐年上升。目前手术切除肿瘤被公认为治疗肝内胆管癌的唯一手
伴随着国民的消费水平迅速提升,商品的消费市场日益扩大,商家为了保证自身利益越来越注重品牌效益,随之而来对商业防伪的需求也日益提升。由于互联网技术的发展以及互联网商业的普及,现在的防伪系统已经从传统材料型防伪系统转为利用互联网网上认证的第三代防伪系统,互联网防伪系统具有查询便捷、防伪精度高、成本较低的优势,但是互联网防伪系统往往具有用户查询操作繁琐、成本较高的问题。二维码作为互联网中重要的线上和线下
井陉东天门文物遗迹考察与探微王振华,张慧井陉位于河北西陲,与山西接壤,扼太行山东西往来的要冲,自古被称为天下九塞之一。《太平寰宇记》载:"四方高,中央下,如井之深,如灶之陉……故
储存推进剂用的储罐是火箭、卫星、飞船等航天飞行器不可缺少的部件。在当前航空航天飞行器动力系统中,要求动力系统用储罐具有满足长期贮存、质量轻、质心可控等要求。目前
<正>音乐课程的新理念要求我们音乐教师课堂上实施的不仅仅是狭义的"技艺性"教育,它的最终目的是为了培养学生成为具有完善个性的人。音乐课正在改变单一的"以识谱为目的,以
主要论述了在ABS/PVC共混体系中PVC用量、相容剂用量和复合阻燃剂用量对ABS/PVC共混体系性能的影响。研究结果表明,所研制开发的Z11.7号共混合金已达到PA76 6号共混合金的性