论文部分内容阅读
本文首先,介绍了语音识别技术的国内外发展状况,分析了语音识别系统商品化过程中面临的困难,并在此基础上阐明了本课题的研究背景和意义。
其次,根据语音识别系统的基本构成模型,分别介绍了预处理、端点检测、模板生成、模板管理以及模板匹配等各部分中所涉及到的语音数字信号处理和模式识别的基本原理,并在PC机上编写了各部分的仿真子程序模块。
分别采用基于匹配方法的动态时间规整法(DTW)和基于概率统计方法的隐马尔可夫模型(HMM)实现了汉语孤立数字的语音识别。动态时间规整法成功解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别实验中得到了良好的效果,这种算法系统开销小,识别速度快,在小词汇量的语音命令控制系统中非常有效;隐马尔可夫模型对时间序列具有很强的建模能力,通过对时间序列的特征参数的训练,为每个语音建立一个隐马尔可夫模型,待识别语音通过与各个隐马尔可夫模型匹配,即得到识别结果,在大词汇量语音识别系统中,常采用隐马尔可夫模型。
最后,开发设计了一个基于嵌入式WindowsCE.net系统的自主机器人语音交互系统。介绍了SDK的功能,及系统的实现过程。利用SAPI进行二次开发,实现了命令词识别,使机器人既能听懂命令又能讲话。