论文部分内容阅读
随着社会经济的发展与科技技术水平的不断提高,机器人在人类生产活动和社会活动中的应用日益广泛。在人机交互过程中,语音是一种较为理想的信息交流方式。因此,语音识别与语音合成技术成为人机交互研究领域的热点。目前基于计算的中文语音合成技术比较成熟,合成语音质量也比较高,如语音电子邮件。但是,在嵌入式系统中由于存储容量和处理器运算速度的限制,使得在嵌入式系统中合成语音的自然度、可懂度还不够高。其中一个重要原因就是合成语音速率不可调节。本文针对此问题,深入研究了嵌入式系统中语音速率的控制方法,提出了特殊字符标注的方法,提高了合成语音的自然度、可懂度。本文首先深入研究了语音信号在时域和频率分析方法的基本理论。在时域分析中讨论了短时加窗、端点检测、短时平均能量、短时过零率以及自相关函数等相关问题;在频域分析中讨论了短时傅里叶变换法、语谱图等相关问题。详细论述了如何利用语音信号的时域特征和频率特征进行端点检测、基音周期估计、共振峰估计的方法。在MATLAB环境下对讨论的各种算法进行了仿真、验证。本文研究的最终目的是利用语音合成技术实现无人自动解说系统,即将以文本形式存储的内容转换为语音信号方式输出。为了解决利用中文语音合成芯片构成的文语转换系统语音速率不可调节的缺点。本文提出了特殊字符标注的方法,即先用特殊字符对输入的文本进行标注,把文本分成了不同类型的信息帧,然后将信息帧传输给单片机。系统自动判断信息帧的类型,根据不同的信息帧设置不同的延迟时间从而达到调节播放语音速率的目的。通过实验测试结果表明本文提出的特殊字符标注方法,不仅实现了语音速率的随意调节,同时也提高了播放语音的可懂度和自然度。并且与传统的PCM编码方法相比,采用文语转换方式所需要的存储器容量至少可以节省80%。使得语音合成能够在嵌入式系统中实现。本课题在研究语音合成技术的基础上,设计并研制了嵌入式中文语音合成系统。该系统应用到电子技术实验教学中,经过实际应用测试取得了很好的应用效果。