东乡方言语音生成的研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:sevenzzzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现阶段大多研究学者关注和研究的方言语音合成,都是从文字到语音的合成(Text-To-Speech,TTS)。文本输入后经过“文本规范化、文本切分、语法分析”等语言学的处理,再合成语音。中国地域辽阔、民族众多、方言语言丰富,而我国存在一些方言,没有文字表示。基于此,本文以无文字的东乡方言为研究对象,分析了东乡方言的语言学特点和语音学特点,设计了一套东乡方言的机读音标方案,建立了一个东乡方言的语料库,并用标音方案标注语料;在此基础上,利用基于隐markov模型(Hidden Markov Model,HMM)的统计参数语音合成方法,和基于深度神经网络(Deep Neural Networks,DNN)的语音合成方法,实现了东乡方言的语音生成。本文的主要工作和创新如下:1.建立了一个东乡方言的语料库。通过分析东乡方言的元音、辅音、词语、句型的语言学特点,和基频、声调等实验语音学的特点,建立了一个共800句的东乡方言语料库。其中包括400句的东乡方言公交车报站场景语句和400句地道东乡方言语句,基本包括了东乡方言的元音、辅音、声调以及常用词汇的发音特点。请东乡话地道的东乡族大学生在专业录音棚中录制,保存为Microsoft WAV格式(单通道、16bit、16kHz采样频率)。2.设计了一套东乡方言机读音标方案。由于东乡方言没有文字,通过参照汉语普通话的机读音标,设计了一套东乡方言的机读标音方案SAMPA-DX(Speech Assessment Methods Phonetic Alphabet for Dong Xiang)。并用此标音方案,逐句标注语音语料。3.实现了无文字的东乡方言的语音生成。先对标注好的语料结合语境分析,分别进行HMM训练和DNN模型训练,分别得到每个合成基元的HMM和DNN模型。然后给定一个公交车报站场景,当输入公交站名以及公交车序号,经过语境分析,生成东乡方言报站语句的上下文相关标注,进而生成东乡方言公交报站语音。实验结果表明,本方法可以实现无文本语言的语音生成,生成的东乡方言公交报站语音有着较高的语音自然度、相似度和音质。
其他文献
随着目前人们审美水平及鉴赏能力的不断提升,人们在观赏电影的过程中对于观影质量及观影体验也有着越来越高的要求,因而保证电影放映质量与效果十分必要。在电影放映过程中,
<正>0引言实验室对高温炉及干燥箱、培养箱温度的控制精度要求并不是很高,所以温度控制绝大部分都采用二位式温度调节仪表控制。它是根据炉内实际温度与设定值的偏差,通过仪
以武陵山区的湘西州、张家界、怀化、铜仁、恩施州和渝东南为案例地,运用综合发展指数、最近邻指数和相对通达度指数等方法,利用2003—2012年相关统计数据,测算分析了交通运
被"五四"运动震上文坛的冰心,开创了"问题小说"的先河;随着思想革命的深入,她力图以"爱的哲学"解答人生问题;在现实和时代激荡下,她以作品反映战火中的妇女命运。建国后,冰心
中小企业对国家和地区的经济发展、社会稳定起着重要的作用,而技术创新是企业发展的核心动力。目前,我国中小企业的技术创新正面临企业家创新意识淡薄、资金人才匮乏、融资渠
目的:分析某高校医院门诊不合理用药处方的特点,提出解决的对策,以提高处方质量,促进合理用药。方法:采用回顾性分析方法,抽取2011年7月至12月门诊处方共计17913张。将不合理
在控制农户家庭生计资本、经营结构和外部环境变量的基础上,基于四川省典型山区随机抽样农户调查数据,利用分位数回归探究农村公共品投资规模、综合效率和村落自筹资金比例对
新媒体时代下,传统媒体发展受到巨大的冲击和考验,大有被新媒体取而代之之势,传统媒体在新的发展形势下,面临转型的困境和挑战。本文从新媒体与传统媒体的特征入手对比分析,
针对《数学地质》课程教学中数学推理较多、软件操作困难等导致学生学习兴趣不足的问题,在教学中采取如下措施:改进教学措施,增加吸引力;加强应用知识教学,提升关注度;增加实
<正> 薛毅:九十年代的知识分子受到了一种无形而又巨大的力量的挑战,在这种挑战面前,知识分子多少有点窘迫、慌乱和失态。如何认识和把握这种巨大的力量实际上是非常关键的。