【摘 要】
:
语音识别是实现人机通信的重要手段。让计算机能听懂人类的语言,是人类自计算机诞生后梦寐以求的追求。语音识别技术的理论研究和产品的开发具有深远的理论研究意义和实际应用
论文部分内容阅读
语音识别是实现人机通信的重要手段。让计算机能听懂人类的语言,是人类自计算机诞生后梦寐以求的追求。语音识别技术的理论研究和产品的开发具有深远的理论研究意义和实际应用价值。近年来,智能化产品和消费类电子产品的迅速发展推动了语音识别系统大量从PC平台转移到嵌入式设备中,嵌入式语音识别技术得到了越来越多的应用,同时也成为语音识别领域发展的重要方向。
本文回溯语音识别技术发展史,介绍了研究现状和目前面临的问题,分析了语音识别系统的结构,论述了语音识别系统中涉及到的基本概念及原理,包括语音信号的数字化、端点检测、特征参数提取和常用识别技术。其中端点检测中阐述了短时能量、双门限和频谱方差三种方法。根据语音信号特点,系统地研究了基于声道模型的线性预测倒谱参数(LPCC)和基于听觉模型的美尔频率倒谱参数(MFCC)两种语音识别主要特征参数提取方法。
实现了嵌入式语音识别系统的搭建,研究中选择三星公司的基于ARM9处理器S3C2410和Philips公司的UDA1341语音编码芯片,构造本系统的开发平台。使用嵌入式开发技术移植引导加载程序VIVI,定制和移植嵌入式Linux内核,建立根文件系统。重点研究了音频驱动程序开发方法,通过分析驱动程序在内核空间的工作原理,设计了一种基于模块加载方式的音频设备驱动程序,实现驱动程序并将其移植到ARM开发板上。
由于嵌入式硬件资源的限制,为得到一个高性能、低运算量的特定人孤立词的识别系统,本文剖析了经典动态规整DTW算法,提出一种改进的快速DTW算法:通过减少匹配路径和限制搜索宽度,降低计算复杂度和对存储空间的需求,同时保持较高的识别率。最后进行了相关的仿真实验,验证了使用该算法在一定程度上加快了识别速度,具有较好的识别效果,提高了系统整体性能,表明系统设计方案的可行性和有效性。
其他文献
面对目前工作流协同化发展的现状,业界对工作流管理系统的标准化需求越来越明显。本文旨在遵照WfMC参考模型,在自主研发的工作流引擎RRFloEng的基础上实现规范的引擎接口。本文
当下能源危机日益突出,环境问题的日趋严重,人们迫切需要利用可再生能源来调整当今社会的能源结构,实现可持续发展。对比其他可再生能源,太阳能优势明显,应用广泛,分布式并网发电为其主要应用方式之一。由于光伏电池输出的是直流电,不能直接并网,需要将其转换为交流电才能注入电网当中,因此对光伏并网逆变技术的研究具有一定的意义。本文以单相LCL型光伏并网微逆变器为研究对象,对其硬件拓扑结构以及控制策略进行了分析
在我国的电力系统中,在我国的电力系统中,中性点接地方式主要有两种,即中性点直接接地方式和中性点不直接接地方式。6-66kV配电网一般采用小电流接地方式。小电流系统之所以叫小电流接地系统是因为在发生单相接地故障时,由于不能形成有效的低阻抗回路,接地电流很小。配电网发生小电流接地故障的概率非常高,可占总故障的80%左右。当发生单相接地故障时,系统线电压仍然保持对称,所以在短期内可以继续运行。但是长时间
智能移动机器人是一个集传感器技术,规划与决策,以及人工智能等多功能多学科于一体,并能够自主完成特定任务的综合感知系统。随着计算机技术爆炸式的更新,信息处理及智能控制
智能视频监控系统由于它能够对监控场景中的运动目标的行为进行分析,因此越来越受到人们的青睐。传统的视频监控系统大多数只对运动目标进行跟踪,而缺乏主要的目标行为分析功
移动机器人气味源定位(本文也称之为主动嗅觉)研究的目标是利用机器人及其传感系统探测并最终确认环境中某种气味/气体的源头。主动嗅觉在危险环境探索、灾难营救、有毒有害
GIS系统把各种地理信息和有关视图结合起来,有着广泛的应用前景,被公认为2l世纪的支柱产业之一。但是,在GIS发展过程中出现的各种GIS系统存在着数据格式不一致、不能兼容及不能
本文以成都电子机械高等专科学校新校区配电监控系统项目为背景,提出了基于.NET框架的变配电站监控和Web服务器的远方调度系统的设计方法和实现过程。该监控系统软件的开发环境完全采用当今最流行的.NET平台,开发语言采用最先进的C#语言,数据库采用SQL Server 2000。整个系统可以分为两个部分,一部分是变配电站端监控,另一部分是远方调度。变配电站端监控系统的开发由原来的两种平台混合开发模式改
随着计算机技术,特别是Intemet技术的发展,基于Web的软件技术得到了空前的发展,各行业信息化进程日益加快,国内大小企业都在构建满足本行业发展的Web信息系统。然而,Web软件的开发
随着计算机技术和采集设备制造技术的飞速发展,人们对视觉感受的要求越来越高,表示事物的数据维数也越来越大,例如高清图像和视频数据等。在压缩感知领域中往往认为,这些高维