基于ASR的儿童语言教育系统的研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:cctasty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代计算机技术的普及和发展,计算机的使用越来越深入到人们的日常生活中。人类与计算机进行交流时,最直接和方便的方式就是语言交流,所以语音识别和语音合成技术已成了现代科技发展的一个标志,语音识别和语音合成也因此成为现代计算机技术研究和发展的重要领域之一。语音识别技术与多种学科的研究领域都有联系,这些领域的科研成果也成为推动语音识别技术发展的重要因素。语音识别技术已经取得了一些成就。但是,大多数语音识别系统仍局限于实验室中试用,远远没有达到实用化的要求。本文研究了语音自适应技术中两种常用的说话人自适应方法:最大后验概率(MAP)方法和最大似然线性回归(MLLR)方法。在此基础上,本文提出一种适合于语音识别的复合渐进自适应方法。这种新方法成功地结合了MAP和MLLR两种方法的优点。新方法使用了一个全局转移矩阵来简化MLLR模块,用来解决环境和说话人生理引起的差异,提供了更加精确的MAP模块初始模型。另外,渐进的MAP模块用来精细的刻画基于音素层次的差异,同时也确保了整个方法的渐进性。本文应用复合渐进方法对微软语音识别引擎进行了改进,在随后的验证性实验中,这种复合方法取得了较好的效果。实验证明,这种新方法能够有效地克服说话人差异和环境差异对识别系统的影响,能较好地适合语音识别系统的要求。在上述理论研究成果的基础上,本文结合了现代教育技术的成果与儿童语言教育的需求,成功地应用改进后的微软语音识别引擎开发了儿童语言教育软件,实现了中文语音识别、VC++、Flash和微软语音识别引擎之间的通讯、中文/拼音/英文语音识别、发音正误判断动画、TTS等功能。该软件形象直观,具有较强的实用性,是一种较为成功的儿童语言教育工具。本文通过对语音识别自适应技术中的方法研究,将其成果应用到了儿童语言教育实践中去,取得了较为良好的效果,具有较为理想的研究和应用价值。
其他文献
随着信息的多元化及数字化的迅猛发展,信息安全技术越来越显示其重要地位,而且信息安全技术应用水平的高低直接影响了信息高速公路建设的进一步发展。认证技术是信息安全理论与
本文详细阐述了电子式多功能电能表的设计和实现。系统硬件设计采用MCU(微控制器)结合ASIC(能量采集芯片)的方式,在此硬件平台的基础上采用模块化软件设计方法实现了有功和无
随着经济和社会的发展,城市的交通拥堵和环境污染问题日益凸显。智能交通系统(IntelligentTransportationSystem,ITS)的运用能够在很大程度上缓解此类问题的发生。作为智能交通
压缩传感是2006年正式被提出的一种开创性的信号与信息处理理论。该理论中信号采样与压缩可以同时进行,采用求解最优化计算方法,仅依据少量的采样信号就可以使用重构算法较为精
学习Bayesian网络问题是人工智能领域的一大热点问题。由于网络结构的空间分布随着变量的数目和每个变量的状态数量呈指数级增长,因此学习Bayesian网络是一个NP难度问题。为了
在互联网发展迅速的当今时代,由于数字媒体便于复制、分发等特性,受知识产权保护的数字产品和内容被批量复制和随意传播的现象普遍存在,数字版权管理应运而生,并且受到了全球许多
随着互联网的快速发展,高效稳定的路由协议成为保障网络性能的重要因素。目前互联网域间路由协议采用的是BGP4,在未来的IPv6网络中,域间路由协议将采用边界网关协议BGP4的扩展版
随着微处理器技术、互联网技术与通信技术的飞速发展,微型化和专业化成为发展的趋势,嵌入式产品逐渐成为信息产业的主流。同时数字视频技术应用广泛,要求其更加灵活地适应现
随着社会信息化的普及,信息作为一种无形的资源对人们生活的影响越来越大,信息安全已经成为社会关注的焦点。网络带宽和速度的迅猛增长,使得信息安全领域的工作变得更加困难,
研究了随机可靠性试验数据的处理方法与软件。完成了3项任务: 第一,根据可靠性寿命截尾试验原理,用待测随机变量代替时间参量,拓展可靠性寿命截尾试验的组织方法与数据处理方