论文部分内容阅读
文语转换(TTS)是近年来语音处理领域内比较热门的研究方向,其功能是由计算机将文字文本转换成语音并输出。一个成功的文语转换系统输出的语音应当音质清晰,自然流畅。因此,一个文语转换系统,应当具有一个性能优良的语音合成模块。但是仅仅将一个个单字的发音机械地连接起来,这样合成的语音缺乏自然度。语音的自然度取决于其发音声调的变化,而在连续语流中一个字的发音不仅与这个字本身的发音有关,而且还要受到它前后与其相邻的字的发音的影响,所以在文语转换系统中,必须事先对文本进分析,根据上下文的关系来确定每个字发音的声调应如何变化,然后用这些声调变化参数去控制语音的合成。因此,文语转换系统还应当具有文本分析和韵律控制功能的模块。文本分析、韵律控制和语音合成这三个模块是文语转换系统的三个核心部分。 中国是一个多方言的国家,许多方言具有悠久的历史和较大的使用范围,而且方言与普通话相比,在发音、语法、用词等方面都有很多不同之处。因此,进行方言文语转换系统的研究,在学术和应用方面都有很大的意义。 汉语的发音可以由声母、韵母和声调这三个因素来决定,普通话和方言都具有这个共同的特点。从时域波形上看,汉语语音的波形可以分为两种类型,一种类型的波形是非平稳段,这部分波形的形状变化快,没有明显的规律;第二种类型的波形为平稳段,其特点是波形具有准周期性,形状相对稳定。非平稳段主要存在于语音的声母段和韵母的韵尾段,平稳段存在于韵母的韵腹部分。语音的声调反映了发音周期(或频率)的变化。根据语音的这些特点,对连续语音的基音周期变化规律进行测量与统计,可以总结出连续语音的变调规则,来实现对合成语音的韵律进行修正与控制,以提高合成语音的自然度与可懂度。 吴语文语转换中语音合成与韵律控制的研究 摘要 本文以苏州方言(吴语)为对象,对文语转换系统中的语音合成 和韵律控制进行了一些开创性的研究,提出了一种利用语音的时域波 形进行语音合成的新方法一基音同步帧叠接法①SFC),并在此基 础上用一种新的方法对合成语音进行韵律调整。对于文本分析模块, 卜匹丛习间口JL口j夕怪刁 酉回A刃)回卜利J/J回*b回吃-’J卜口刁夕问卜问叫甲卜口利卜口习一回已回吕回回J卜间勾乡且回叮yN—J”切0卜多口与卜回J吵JM回刃J岁叱蜘了二多飞卜罗 则可以借鉴普通话文语转换系统中所使用的方法,所以在本文中没有 作为主要工作。利用这些方法,进行了吴语文语转换实验,实验结果 表明,本文提出的这套语音合成与韵律控制方法是可行和有效的。