嵌入式语音合成技术的研究

被引量 : 0次 | 上传用户:yaleqd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的发展与科技技术水平的不断提高,机器人在人类生产活动和社会活动中的应用日益广泛。在人机交互过程中,语音是一种较为理想的信息交流方式。因此,语音识别与语音合成技术成为人机交互研究领域的热点。目前基于计算的中文语音合成技术比较成熟,合成语音质量也比较高,如语音电子邮件。但是,在嵌入式系统中由于存储容量和处理器运算速度的限制,使得在嵌入式系统中合成语音的自然度、可懂度还不够高。其中一个重要原因就是合成语音速率不可调节。本文针对此问题,深入研究了嵌入式系统中语音速率的控制方法,提出了特殊字符标注的方法,提高了合成语音的自然度、可懂度。本文首先深入研究了语音信号在时域和频率分析方法的基本理论。在时域分析中讨论了短时加窗、端点检测、短时平均能量、短时过零率以及自相关函数等相关问题;在频域分析中讨论了短时傅里叶变换法、语谱图等相关问题。详细论述了如何利用语音信号的时域特征和频率特征进行端点检测、基音周期估计、共振峰估计的方法。在MATLAB环境下对讨论的各种算法进行了仿真、验证。本文研究的最终目的是利用语音合成技术实现无人自动解说系统,即将以文本形式存储的内容转换为语音信号方式输出。为了解决利用中文语音合成芯片构成的文语转换系统语音速率不可调节的缺点。本文提出了特殊字符标注的方法,即先用特殊字符对输入的文本进行标注,把文本分成了不同类型的信息帧,然后将信息帧传输给单片机。系统自动判断信息帧的类型,根据不同的信息帧设置不同的延迟时间从而达到调节播放语音速率的目的。通过实验测试结果表明本文提出的特殊字符标注方法,不仅实现了语音速率的随意调节,同时也提高了播放语音的可懂度和自然度。并且与传统的PCM编码方法相比,采用文语转换方式所需要的存储器容量至少可以节省80%。使得语音合成能够在嵌入式系统中实现。本课题在研究语音合成技术的基础上,设计并研制了嵌入式中文语音合成系统。该系统应用到电子技术实验教学中,经过实际应用测试取得了很好的应用效果。
其他文献
企业营销的成本控制应当是多方面的。主要应从供销规模控制、适宜质量控制、网点布局控制、服务设施控制、产品寿命周期控制和广告方式控制等方面进行研究探索。可适当提高可
碰撞预判技术(Pre-Crash)是集成了主动安全和被动安全的新兴汽车安全领域。通过使用主动安全领域里面应用较多的毫米波雷达进行环境探测,可以对即将发生的碰撞事故做预先的感
在大数据时代,提升财经记者的数据素养对于世界解读中国经济发展、民众了解和判断相关行业和企业状况有着重要意义。通过梳理数据素养的概念内涵,从数据意识、收集数据的能力
随着信息社会的发展和人们对隐私关注的不断加强,隐私数据库已经成为当前数据库研究领域和数据安全研究领域的热点之一。与安全数据库不同,隐私数据库要达到隐私保护和隐私使
二十一世纪是个处于全球化、信息化、网络化、专业化和知识化环境中的时代。随着全球化的趋势成为一种潮流,信息技术也越来越受到各方的重视。MRP, ERP, CRM, SCM, PLM等众多
作为当下热点的战略性新兴产业,其企业成长性如何对政府、企业管理者、投资者都具有重要意义。然而,目前战略性新兴产业的研究中,企业成长性评价相对匮乏。本文通过整理相关企业
在传统的印花系统中,国内许多纺织企业是通过印花人员目测的方法去检验印花过程的准确性。该方法存在着标准不一、检测精度不高、劳动强度大等缺点。近年来,随着机器视觉技术
<正> 一、空管班组资源的潜能。管制员手持话筒对空指挥,是代表一个班组甚至一个管制室行使职责,体现的应是集体的智慧和力量。人是最活跃最积极也是最容易发生变化的因素,错
随着知识经济时代的到来,知识型员工已经逐渐成为目前企业管理以及人力资源资本核心的重要部分,对于企业人才管理以及企业发展都有着非常重要的影响和作用。进行心理契约视角
当代经济和社会快速发展,文化日益不能满足人们的精神需求,教育改革出现瓶颈,人才培养质量下降,大学生就业形势严峻,大学逐步进入公众视野。大学承担着引领社会文化发展的功能,大学