语音识别理论在智能机器鱼中的应用

来源 :沈阳理工大学 | 被引量 : 0次 | 上传用户:mervin10183
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是计算机技术的一个重要发展方向,是指机器通过学习来实现从语音信号到文字符号的理解过程,也就是让计算机听懂人的话,并做出正确的反应。语音识别作为一门交叉学科,与声学、语言学、人工智能、数字信号处理、模式识别等学科有着紧密的联系。 本文介绍了语音识别技术和智能机器鱼的国内外发展状况,阐明了本课题的研究背景和意义,并对语音识别系统的定义、原理和分类作了简单的介绍。根据语音识别系统的基本构成模型,分别介绍了语音信号的分析和预处理、端点检测、特征参数的提取以及模板匹配等各部分中的基本原理和多种算法。 根据设计要求,系统是基于孤立词的小词汇量的语音识别系统,采用了动态时间规整算法,并且由Labview虚拟仪器技术与Matlab相结合完成了语音识别系统的仿真。动态时间规整算法成功解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别实验中得到了良好的效果。这种算法系统开销小,识别速度快,在小词汇量的语音命令控制系统中非常有效。但DTW算法有两个最大的缺陷:一是对端点的敏感性;二是运算量较大。在这个问题上我们采取了折中,在传统的加速算法上进行了改进,采用了半宽松式的端点对准。这样做有两个好处:一是使得DTW算法对端点的敏感性得以大大改善:二是改进后的半宽松式的端点对准更适于硬件的实现。从实验结果来看取得了较好的效果。
其他文献
虚拟人(virtual human或computer synthesized characters)是人在计算机生成的空间(虚拟环境)中的几何特性与行为特性的表示。要实现人在三维虚拟环境中的准确再现,不仅要模拟
三维人脸重建是计算机视觉的核心研究内容之一,它涉及的内容包括三维人脸识别、三维人脸动画、3D游戏仿真、虚拟现实等方面的应用。随着一大批人脸重建算法的涌现,近年来,三维人
随着互联网的广泛应用,互联网上出现了大量的垃圾信息以及各种网络攻击。要想营造一个健康和安全的网络环境,一个重要的手段就是对互联网信息进行分析过滤。过滤垃圾信息和入侵
Linux具有功能强大、开放源码、支持多种硬件平台、模块化设计等优点,在嵌入式领域得到了广泛的应用。但同时Linux是一个分时操作系统,其不可抢占的内核、粗糙的时钟粒度、频繁
可分级视频编码(SVC)作为H.264/AVC的可分级扩展,是正在制订中的视频编码标准。它通过时域层、空域层和质量(SNR)层的混合可分级的机制,在比特流级上实现可分级性,同时具有很
网格使人们可以无缝的集成广域资源来合作解决问题。在网格环境里如何有效的管理资源和调度计算就成为影响网格计算是否成功的最重要因素之一。而资源发现和资源选择又是网格
Linux系统是一款优秀的开放源码的操作系统,正是因为其开放性和可移植性使它在当前的嵌入式产品开发中有着非常重要地位。通用串行总线(USB)作为一种新型总线,日益广泛地应用
Web服务(Web Services)已经成为分布式网络计算的发展趋势。然而现有的Web服务技术只关注对服务输入输出数据类型以及访问细节的说明。由于缺乏语义描述,无法支持服务的自动
工厂各车间选址、医院布局、电脑键盘分布设计、任务分配调度等都可归结为二次分配问题。在理论上,二次分配问题属于组合优化问题,存在“组合爆炸”现象。归因于NP-hard属性,很
手语识别研究的目的是增进聋人与听力健康人之间无障碍的交流,提高计算机对人体语言的理解能力。非特定人手语识别是推动手语识别系统实用化所必须解决的问题。目前,非特定人