论文部分内容阅读
语音识别(Speech Recognition)是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。语音识别技术经过几十年的探索和研究,已经取得了一系列突破性的进展,一些成熟的技术正逐渐应用于实际生活中,近年来,作为一种方便的人机交互手段,语音识别在消费类电子产品和工业控制等领域迅速发展。在嵌入式系统中实现一个能识别较大词汇量、具有较好实时性,并且具有比较高的识别率的语音识别系统,具有很高的理论研究及实用价值。论文首先介绍了语音识别技术的发展背景及国内外研究现状,并对研究的背景项目所要求的各项技术指标进行了介绍和分析。在深入研究语音识别过程中各关键模块(语音预处理,特征参数提取,识别算法)的基础上,对各模块的重点技术进行了研究。在语音预处理模块中,重点研究了预加重、分帧、加窗、短时能量和过零率相结合的端点检测法;在特征提取模块中,通过分析LPCC参数和MFCC参数的实现原理和差异,结合背景项目的要求,阐述选用MFCC参数的原因。在对语音识别的基本原理和三种经典的识别算法研究对比后,论文着重研究了隐马尔可夫(HMM)和基于此模型的语音识别算法,并且在传统的HMM算法基础上,针对HMM模型中状态数对HMM模型参数以及系统识别率的影响,对HMM的模型和识别算法进行了改进,并提出了双模板匹配法。论文在VC6.0平台上构建了一个MFCC参数与改进HMM算法相结合的语音识别系统,系统的识别率在90%以上,满足背景项目的性能要求。最后论文在对现有嵌入式操作系统深入研究的基础上,选用可移植性较好的嵌入式Windows CE操作系统,成功地在以ARM11为核心的开发板上定制和移植了Windows CE 6.0操作系统,通过跨平台的软件开发,成功在搭建好的嵌入式开发平台上实现了大词汇的语音识别系统。实验结果表明,通过对系统的改进,在嵌入式中能够实现一个具有识别率较高,实时性较好的大词汇量语音识别系统。