论文部分内容阅读
语音合成是让机器生成语音输出的技术,以此提供一种信息的语音表达方式。语音合成已经有两百多年的历史,随着计算机技术以及数字信号处理技术的发展,语音合成技术已经开始应用于各个领域。语音合成通常也被称作文语转换(TTS,Text-to-Speech),文语转换系统具备从文本结构的抽象语言分析到语音编码的众多功能组件,能够实现将输入文字转化成语音输出的过程。将TTS技术引入嵌入式系统已成为未来语音合成发展趋势之一。 嵌入式英汉翻译系统主要有语音识别、机器翻译、语音合成三个模块。其中语音合成模块主要实现将翻译后的文本信息,使用TTS技术转换成语音输出的过程。文章基于嵌入式英汉翻译系统研究的需求,研究如何在嵌入式英汉翻译系统中实现TTS功能。文章作了以下几个方面的工作: (1)文章首先了回顾了语音合成的发展历史,国内外的研究现状。分析了语音合成的基本原理,讲述了TTS系统的基本组成部分,以及时域基音同步叠加(TD-PSOLA)合成算法的实现步骤。 (2)综述了现有的语音编码技术以及G.729a语音编码算法的原理。基于应用该算法功能的目的,文章还对G.729a算法的C源码实现进行了分析。 (3)设计与实现了一个基于SPCE061A处理器汉语TTS系统。使用相关工具,采集并压缩包含所有汉字发音的音节数据作为合成语音样本,使用多重查表技术以及相应语音解码API函数,将文本转换成合成语音播放。 (4)针对实际应用中对降低嵌入式英汉翻译系统的算法复杂度,缩短开发周期,将系统快速推向市场的基本需求,文章应用语音合成技术的最新成果,提出并实现了基于TTS芯片的语音合成系统方案。 最后,文章对全文的工作进行了总结,分析了现有设计的不足之处,在此基础上提出进一步的研究方向和建议。