基于DIVA模型的语音生成与获取声道模型及其控制机制的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:l1076223769
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的发展,人们对这个领域的研究不断深入。对类似真人发音的语音生成和获取的控制,是机器人发音系统急需解决的问题。DIVA(Directions Into Velocities ofArtculators)模型是一种用于语音生成与获取后描述相关处理过程的数学模型,也是一种为了生成单词、音节或者音素,被用来控制模拟声道运动的自适应网络模型。在当今真正具有生物学意义的语音生成和获取的神经网络模型中,DIVA模型的定义和测试相对而言是最彻底的,并且是唯一一种应用伪逆控制方案的模型。本文首先介绍了DIVA模型和声道模型的发展和现状,然后对DIVA模型的相关理论进行了介绍,包括DIVA模型的基本概念以及基本结构。然后研究讨论了DIVA模型体觉方向向量到发音速度向量的映射以及DIVA模型的伪逆控制机制,作者提出了基于零空间的再分配伪逆算法对DIVA模型中的伪逆控制求解算法进行改进,避免发音器官过早进入饱和状态,从而提高了DIVA模型的鲁棒性。文章引入EMA(electromagnetic articulograph)数据库,对前田几何声道模型进行描述。采用几何学的自适应的过程描述EMA数据应用到DIVA模型中的方法,从而能够更加准确的估算出DIVA模型语音的生成和获取过程中声道模型的形状。实验以/u/音素为基准,在上颚扰动的情况下,分析DIVA模型中的唇凸与收缩尺寸之间关系,对DIVA模型语音生成与获取过程中的运动等效现象,以及声道参数的配置进行研究与讨论。最后,对研究内容进行了总结,并指出了后续的研究方向,为进一步的研究开拓了思路。
其他文献
车牌是交通场景图像中十分重要的目标类,是交通领域智能视频分析的核心对象之一。良好图像质量的车牌检测与识别,已经有了较为成熟的实用算法;但针对各种复杂背景或松视角约
网络性能代表了网络基础设施向上层应用提供的服务质量,其对于运营商、用户以及应用都具有重要意义。网络性能测量可以为网络运营商提供网络性能监控的基础,为流量工程提供评测
近年来,互联网在人们的日常生活中扮演着越来越重要的角色,每天都会有纷繁复杂的新闻事件以各种各样的形式发布到互联网上。相对于以前传统的报刊杂志,在信息爆炸的当今时代,快节
组播是一种由单个或多个源发送数据包到群组主机的有效通信方式,IP组播技术主要通过路由器实现组播功能,在网络资源的使用上有较高的效率。但是,由于IP组播协议和模型的不足
家庭安全一直是人们关心的问题。传统的家居安防监控系统的各个控制子系统相互独立,未能形成一个有机整体,越来越不能满足用户的要求。安装安全的、符合要求的自动化智能安防系
随着电子商务的迅速发展,人们从网上获取的信息越来越多,顾客有了更大的选择空间同时也带来了一些新的课题。海量的数据信息增加了顾客购买所需的难度,在找到自己需要的商品前必
近年来,信息技术不断发展,互联网络技术在人们的生活中发挥着重要的作用。随之产生的海量数据中存在着大量未被挖掘的信息,没有有效工具的帮助,人们在寻找有效信息的过程中耗
电子邮件是当前互联网上使用最为广泛的服务之一,随着互联网及应用的不断发展,垃圾邮件大量蔓延,造成社会生产力的极大浪费。因此垃圾邮件过滤非常必要,具有重要的理论意义和社会
多视图的学习在最近十几年引起了众多研究人员的极大兴趣和关注。而传统的模式识别和机器学习的方法多是集中在单视图上进行的。这些单视图方法往往通过独立、交替的方法训练
随着互联网的迅速发展,网络问答系统成为一种具有应用前景的远程教育模式。目前国内多数教育问答系统对用户提出问句的理解仍然局限在关键词匹配的模式,反映了实用性和智能性的