基于DIVA模型语音生成和获取中小脑功能及其模型的研究

被引量 : 0次 | 上传用户:leesy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从神经心理学和神经解剖学的角度,对大脑中涉及语音生成和理解区域的相关功能进行描述和仿真,是探究人类语音生成和获取过程的关键,也是近年来人工语音合成研究的热点。DIVA(Directions Into Velocities of Articulators)模型应运而生。它是目前为止较为全面的具有生物物理学意义的语音生成和获取自适应神经网络模型,可以描述和仿真语音生成和获取过程中大脑相关区域的功能,通过控制仿真声道并模拟声道运动来生成音素、音节或单词。另一方面,实验观察指出小脑参与各种各样的运动和认知任务,小脑具有一致性的神经生理学结构、解剖学结构以及与大脑皮层广泛的连通性。因此,目前阶段对于DIVA模型的研究,除了专注于基本语音单元生成时的神经控制的研究外,还需探索该过程中小脑在协调时间特性以及其他方面的作用。本文首先对DIVA模型进行了介绍,包括基本原理、模型结构和学习过程。然后结合小脑在一些运动和认知任务中的功能角色以及小脑现有的功能模型,探讨了DIVA模型整个语音生成和获取过程中小脑所作的贡献,以及小脑如何参与其中进行语音的生成。并在此基础上对DIVA模型进行扩展,在反馈控制系统中从语音映射集到听觉和体觉目标映射集之间以及从反馈控制映射集到发音器官速率和位置映射集之间分别加入小脑模块。为了计算和实现的简明性,嵌入的小脑模块是“等功能”的小脑,而非神经解剖学上完整的小脑模型。从实验结果来看,扩展后的DIVA模型生成的语音更加清晰明确、音质更好,语音信号共振峰频率曲线更加平滑。本文还通过结合小脑解剖学结构以及神经生理学知识,构建了一种适用于DIVA模型的小脑神经网络模型,并应用到DIVA模型的前馈控制系统中。结果表明,新构建的小脑模型的加入可以解决DIVA模型中关于前馈运动命令的学习和生成的问题。
其他文献
介绍了目前国际上尤其是北美珠宝评估的程序和估价方法,对评估的目的、价值水平、评估类型进行了较全面的论述。还分析了成本计算法和市场数据比较法两种最主要的估价方法,系统
随着消费需求的不断升级,人们对酒店产品的要求越来越趋于个性化、多元化。主题酒店应运而生,并凭借其鲜明的主题特色在竞争中脱颖而出,成为了广受关注的市场新宠。与此同时,
随着社会经济的转型,电力体制的改革,电力市场竞争日益激烈,优质高效的供电服务显得更加重要。在此背景下,以客户需求为导向而成立的供电服务指挥中心为国家电网公司在电力市
在描述壮族抛绣球文化历史演变的基础上,分析了其从娱情到竞技的文化演变过程,指出壮族抛绣球带有多元历史文化内涵和功能,且在新的历史时期实现了从"飞砣"到"桂娃"的飞越,这
总结了钻石形成时的温度和压力的 3种计算方法 :(1 )利用钻石中共生包裹体矿物对的主要元素或微量元素的热力学平衡式与温压的关系 ;(2 )利用钻石中氮杂质的浓度和聚集状态与
随着近年来我国经济水平的增长、城市规范化建设的加速,城市的汽车停放问题已经越发严重。自动化立体车库是解决这一问题的必然出路。本文的研究目的在于探索智能化程度更高,同
本文在介绍当前我国宗教的一些基本情况的基础上,分析了加强宗教法制建设的必要性和可能性,我国宗教立法工作的现状,宗教立法中的几个具体问题,提出了加快宗教法制建设的设想。最
本文在大量文献资料的基础上,采用比较的方法,对当代美、日、中幼教法规与政策的发展历史、现状做出了对比研究,揭示其基本特征,总结其经验教训,提出了发展我国幼教法规与政策的具
山水诗作为我国诗苑的一枝奇葩,萌芽于晋宋之际而迅速绽放,并产生了两位成就卓著的名家─谢灵运和谢朓。本文的目的即在于以二谢的身世和山水诗为主要研究对象,对其命运的悲剧和