论文部分内容阅读
旨在改变人机交互界面的文语转换技术(TTS)在许多领域的成功应用使得其潜在价值越来越大。随着研究的不断深入,这项技术已经走出实验室,开始慢的实现一些原本只能以梦想来描述的事情。针对当前国内三大电信运营商的人工服务台播报的话费语音存在明显的欠缺和不足,为了更好的提高播报话费语音的自然度和可懂度,增加人工服务台的友好性,论文对话费文本的文语转换技术进行了研究。论文首先研究了文语转换系统的基本结构,主要包括数据资源库、文本分析模块、韵律分析模块和语音合成模块四个部分。结合话费文本的特殊性,建立了以单音节语音作为基元的语料库;采用人民币小写到大写的转换算法实现文本的正规化;按照正向最大匹配算法,进行语音词的切分;在汉语声调规则的指导下,对待拼接的语音基元的声调进行了变调处理;重点研究了基音同步叠加算法(PSOLA),通过准确的基音标注,结合正常语音的时长特点,以基音周期为单位调整待合成语音的时长;针对待合成基元所处的呼吸群位置,对待合成语音的音强进行修改;在分析、比较了现有各种语音合成方法优缺点之后,论文最终采用波形拼接的方法,通过大量实验证明,在调整待拼接波形拼接点处的平滑长度为两个拼接基元中样点数较少者的1/9时,基本可以达到所有拼接的要求,合成高自然度的话费语音。仿真实验也表明,以单音节语音作为合成基元,采用PSOLA算法和基于时域的波形拼接平滑算法,可以得到自然、流畅的话费语音。此外,论文利用VC++和SQL Server数据库进行通信,在VC++平台上也初步地设计了中文话费文语转换系统的基本框架。仿真合成的语音与当前人工服务台的话费语音相比,合成语音的可懂度和清晰度都是令人满意的,自然度也得到了很大的提高。论文建立的小语料库的汉语文语转换系统,为通信行业更好的服务客户迈出了坚实的一步,提高了人机交互的能力。