基于韵律的蒙古语语音合成研究

来源 :内蒙古大学 | 被引量 : 20次 | 上传用户:YANYUGUOHOU
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究基于大规模语音数据库,采取语音实验的方法考察了蒙古语语音合成中遇到的韵律问题。文章主要由三个部分组成:一是开展了面向蒙古语合成的大规模语音数据库和电子词典等基础资源的建设工作;二是细致描写了蒙古语连续话语中的音节结构变化现象,包括音段的增加和脱落以及由此引起的音节重组问题,并在此基础上探讨了蒙古语口语和书面语的音节对应关系以及音段增减变化和话语韵律结构之间的关系问题;三是深入考察了蒙古语在朗读条件下的韵律组织结构问题,并从音高和音长等基本声学参数入手,对韵律词和韵律短语在朗读话语中的实际表现进行了细致考察,揭示出音高曲拱这一语音声学特征在韵律短语分析过程中的重要作用。本研究得到的结论主要有:一、研制了一套面向蒙古语语音合成的字音转写符号系统,该系统包括词首、词中、词末位置出现的50个元音(包括长元音、短元音、二合元音)符号和27个辅音(基本辅音和借词辅音)符号,并从语音区别特征方面对每个音素进行了描写和区分。语音合成结果表明本文对蒙古语音段系统的描写和区分是有效和必要的,系统而细致的音素分类能在一定程度上改善合成语音的可懂度。二、在连续话语中,词的多个读音在语义、语法、语用三个层面上存在差异。在具体的语境中,每个多音字的读音具有唯一性,根据这一特点,在字音转写过程中可以有效地区分多音字。没有区别词义也不存在语法和语用特征的多音字属于读音规范化范畴的问题,有进一步整理合并的必要。三、在单词层面上,蒙古语单音节词在口语和书面语中的音节结构基本一致,而针对双音节词的书面语读音与口语读音之间的不对应性,本研究细致归纳出了音节结构变化的12条规律。多音节词在口语中的音节结构变化从词末音节开始往前变,并遵循双音节词的音节结构变化规律。在蒙古语口语中,音节重组与音节中的元音类型以及该音节在词中的位置有一定的联系:短元音音节的结构容易发生变化,而长元音音节和二合元音音节的结构比较稳定;词首音节(不包括单音节词)的结构比较稳定,词中音节和词末音节相对容易发生音节重组。根据这一特点,本研究把蒙古语口语中的音节分为稳定音节与易变音节,并认为在蒙古语语音合成的字音转写中易变音节是转写的重点和难点。四、在连续话语层面上,引起音节结构变化的主要因素是名词附加成分和词缀化虚词,这些附加成分或虚词在书写形式上与其他成分是分开的、但在口语读音中却往往不能单独构成一个独立音节。它们在连读后发生的音节重组规律与单词内部的音节变化规律基本一致。当名词附加成分的音节类型是V、C、 VLC时,需要借助其前置音节的辅音来构成独立音节。当附加成分的音节类型是CVL时,其表现比较稳定,在连读时能单独构成词末音节。蒙古语口语中的音段脱落和增加、音节重组等现象与话语的韵律结构有一定的联系:韵律词是此类音变现象的作用域,名词与名词附加成分之间发生的音节重组以及音段增加和脱落等现象通常发生在韵律词内部。因此,可以把名词附加成分看做预测韵律词边界的有用线索。研究结果还表明,词缀化虚词的韵律作用域存在一定区别:虚词“(?)”的作用域是韵律词,虚词“(?)”的韵律作用域是韵律短语,虚词“(?)”和“(?)”的作用域是语调短语。五、本研究发现,在正常朗读的陈述句中,每个韵律短语一般都包含一个相对独立完整的音高曲拱,有且仅只有一个音高峰值,在此之前音高呈上升走势,在此之后音高呈下降走势,并且一般会一直延续到韵律短语的结束位置。这种“低-高-低”的音高变化模式构成了一个个相对独立完整的音高曲拱,起始于韵律短语之首,结束于韵律短语之末。根据这一发现,本研究认为,当一个语句内部既无标点符号又无显著停顿时,可在一定程度上参考音高的变化走势来帮助确定其内部的韵律短语边界位置:韵律短语边界往往处于两个音高曲拱的交界处。数据统计结果还表明,韵律短语边界前音节会有一定的延长。另外,词末弱短元音也是预测韵律短语边界的重要语音事件。六、韵律词边界处没有可明显感知到的停顿,也没有明显的延长。韵律词内部的每个音节的时长分布与该音节在韵律词内的位置有一定关系:尾音节时长>首音节时长>中间音节时长。韵律词在韵律短语中的位置会影响韵律词的长度,通常韵律短语边界处的韵律词时长比韵律短语中间位置上的韵律词时长略长。韵律词在韵律短语中的位置会影响韵律词的音高特性。根据统计,韵律词主要有以下4种组构方式:(1)1至5个音节的单个语法词;(2)并列关系的两个单音节语法词;(3)1至4音节的语法词和一个单音节虚词的组合;(4)处于韵律短语边界位置的单音节语法词或功能词。七、语音合成结果表明,在增加韵律短语和韵律词的切分信息之后,能够在一定程度上改善合成语音的自然度。但由于目前用于训练的韵律切分语料还相对较少,所以导致合成语音的自然度提升效果不够显著。但作者相信,随着对蒙古语韵律特性的研究逐渐深入,以及在训练过程中不断增加包含韵律切分信息的语料,将有可能合成出高质量、高自然度的蒙古语语音。
其他文献
<正>白茶淡雅清香,滋润人的肺腑,它的淡淡绿意,让你如沐清晨的阳光,身边飘着温馨的茶香……安吉白茶盛产于浙江省美丽的竹乡——安吉。“一梦如是江南忆,汲来活水煮新茗;茶香
阿尔茨海默病(Alzheimer&#39;s disease,AD)是一种以获得性持续性记忆减退,认知功能障碍以及行为异常为特征的神经退行性疾病,其发病机制有许多种假说,如胆碱能机制,慢性缺血
随着社会经济的发展,人们走出了饥寒型的生活模式,步人温饱型。当人们在基本解决温饱问题之后,生活向小康型过渡必然要求有更加健康的体魄,以充分获得物质享受机会,因此对医
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的观察在常规西医治疗的基础上加用中药宣痹汤加减治疗湿热型类风湿关节炎的疗效。方法将60例符合纳入标准的患者随机分为治疗组与对照组,对照组30例采用常规西医治疗,治疗
以长株潭城市群城市森林为研究对象,对其降温增湿、涵养水源、保持土壤、固碳制氧、净化空气、保护生物多样性等生态系统功能进行了初步估算。结果表明:该地区森林生态系统的降
以农林废弃物稻壳、锯木屑、树皮等为主要原料,经混料回归试验设计,研究了油茶容器育苗的基质配方对油茶嫁接成活率、抽梢长、生根量的影响。试验结果表明:不同配方对苗木成活
风电功率预测是解决风电不确定性影响的重要基础和必要手段,高比例风电并网条件下对每个时刻点的预测精度要求都将更为严格。训练样本是影响预测精度的关键因素之一,但由于实
《祖堂集》是研究唐五代时期语言非常重要的资料,对于认识近代汉语乃至整个汉语史的面貌均具有较高价值。助词研究是近代汉语语法研究的主要内容之一,全面考察《祖堂集》的助词
对人工林木材、劣质材、采伐与加工剩余物等制成的木粉、木纤维改性,制成性能良好木质基复合材料,具有重要意义.将经过改性分散后的纳米CaCO3,均匀加入到木粉和木纤维(比例为1∶1)中,通过添加脲醛树脂,组胚,热压成型,制得木质基-纳米CaCO3复合材料.利用激光粒度仪、FTIR、XRD分别表征纳米CaCO3分散后的粒径分布,改性剂对纳米CaCO3的改性效果以及纳米CaCO3在复合材料里的结构,并对木
期刊