论文部分内容阅读
本研究基于大规模语音数据库,采取语音实验的方法考察了蒙古语语音合成中遇到的韵律问题。文章主要由三个部分组成:一是开展了面向蒙古语合成的大规模语音数据库和电子词典等基础资源的建设工作;二是细致描写了蒙古语连续话语中的音节结构变化现象,包括音段的增加和脱落以及由此引起的音节重组问题,并在此基础上探讨了蒙古语口语和书面语的音节对应关系以及音段增减变化和话语韵律结构之间的关系问题;三是深入考察了蒙古语在朗读条件下的韵律组织结构问题,并从音高和音长等基本声学参数入手,对韵律词和韵律短语在朗读话语中的实际表现进行了细致考察,揭示出音高曲拱这一语音声学特征在韵律短语分析过程中的重要作用。本研究得到的结论主要有:一、研制了一套面向蒙古语语音合成的字音转写符号系统,该系统包括词首、词中、词末位置出现的50个元音(包括长元音、短元音、二合元音)符号和27个辅音(基本辅音和借词辅音)符号,并从语音区别特征方面对每个音素进行了描写和区分。语音合成结果表明本文对蒙古语音段系统的描写和区分是有效和必要的,系统而细致的音素分类能在一定程度上改善合成语音的可懂度。二、在连续话语中,词的多个读音在语义、语法、语用三个层面上存在差异。在具体的语境中,每个多音字的读音具有唯一性,根据这一特点,在字音转写过程中可以有效地区分多音字。没有区别词义也不存在语法和语用特征的多音字属于读音规范化范畴的问题,有进一步整理合并的必要。三、在单词层面上,蒙古语单音节词在口语和书面语中的音节结构基本一致,而针对双音节词的书面语读音与口语读音之间的不对应性,本研究细致归纳出了音节结构变化的12条规律。多音节词在口语中的音节结构变化从词末音节开始往前变,并遵循双音节词的音节结构变化规律。在蒙古语口语中,音节重组与音节中的元音类型以及该音节在词中的位置有一定的联系:短元音音节的结构容易发生变化,而长元音音节和二合元音音节的结构比较稳定;词首音节(不包括单音节词)的结构比较稳定,词中音节和词末音节相对容易发生音节重组。根据这一特点,本研究把蒙古语口语中的音节分为稳定音节与易变音节,并认为在蒙古语语音合成的字音转写中易变音节是转写的重点和难点。四、在连续话语层面上,引起音节结构变化的主要因素是名词附加成分和词缀化虚词,这些附加成分或虚词在书写形式上与其他成分是分开的、但在口语读音中却往往不能单独构成一个独立音节。它们在连读后发生的音节重组规律与单词内部的音节变化规律基本一致。当名词附加成分的音节类型是V、C、 VLC时,需要借助其前置音节的辅音来构成独立音节。当附加成分的音节类型是CVL时,其表现比较稳定,在连读时能单独构成词末音节。蒙古语口语中的音段脱落和增加、音节重组等现象与话语的韵律结构有一定的联系:韵律词是此类音变现象的作用域,名词与名词附加成分之间发生的音节重组以及音段增加和脱落等现象通常发生在韵律词内部。因此,可以把名词附加成分看做预测韵律词边界的有用线索。研究结果还表明,词缀化虚词的韵律作用域存在一定区别:虚词“(?)”的作用域是韵律词,虚词“(?)”的韵律作用域是韵律短语,虚词“(?)”和“(?)”的作用域是语调短语。五、本研究发现,在正常朗读的陈述句中,每个韵律短语一般都包含一个相对独立完整的音高曲拱,有且仅只有一个音高峰值,在此之前音高呈上升走势,在此之后音高呈下降走势,并且一般会一直延续到韵律短语的结束位置。这种“低-高-低”的音高变化模式构成了一个个相对独立完整的音高曲拱,起始于韵律短语之首,结束于韵律短语之末。根据这一发现,本研究认为,当一个语句内部既无标点符号又无显著停顿时,可在一定程度上参考音高的变化走势来帮助确定其内部的韵律短语边界位置:韵律短语边界往往处于两个音高曲拱的交界处。数据统计结果还表明,韵律短语边界前音节会有一定的延长。另外,词末弱短元音也是预测韵律短语边界的重要语音事件。六、韵律词边界处没有可明显感知到的停顿,也没有明显的延长。韵律词内部的每个音节的时长分布与该音节在韵律词内的位置有一定关系:尾音节时长>首音节时长>中间音节时长。韵律词在韵律短语中的位置会影响韵律词的长度,通常韵律短语边界处的韵律词时长比韵律短语中间位置上的韵律词时长略长。韵律词在韵律短语中的位置会影响韵律词的音高特性。根据统计,韵律词主要有以下4种组构方式:(1)1至5个音节的单个语法词;(2)并列关系的两个单音节语法词;(3)1至4音节的语法词和一个单音节虚词的组合;(4)处于韵律短语边界位置的单音节语法词或功能词。七、语音合成结果表明,在增加韵律短语和韵律词的切分信息之后,能够在一定程度上改善合成语音的自然度。但由于目前用于训练的韵律切分语料还相对较少,所以导致合成语音的自然度提升效果不够显著。但作者相信,随着对蒙古语韵律特性的研究逐渐深入,以及在训练过程中不断增加包含韵律切分信息的语料,将有可能合成出高质量、高自然度的蒙古语语音。