论文部分内容阅读
计算机在人类生活中扮演的角色越来越重要,人类期望与计算机的交流不再仅仅只是依靠键盘输入,而希望能够用更加直接快速的方式与之进行交流,让计算机能够听懂人类的自然语音。语音识别就是在人类的这种期许之下才渐渐发展起来的,这是一门涉及多学科的新兴科学,具有广泛的应用前景。随着计算机处理能力和语音处理技术的迅速提高,语音识别技术也得到了飞速的发展,相关的研究成果层出不穷。越来越多的涉及语音识别技术的产品走进了人类生活的方方面面,许多智能家居产品中都有语音识别的功能模块,这些都为人类的生活提供了便捷。本论文回顾了语音识别技术的发展历史,并对研究现状也做了分析,详细研究了语音识别的基本原理与处理流程。分析了语音信号预处理的过程,如预加重,分帧加窗,端点检测等,并对预处理过程当中的端点检测做了详细的研究,运用双门限端点检测的方法检测出了实验语音的起始端点与结束端点。对于语音信号的特征提取过程,分析了语音的LPC、LPCC、MFCC特征参数提取的方法,通过实验对比分析,发现结合一阶差分及倒谱提升后的MFCC参数较其它特征参数,在识别率及抗噪声性能方面都具备一定的优势,可作为语音识别的特征参数。在对语音识别方法的研究中,首先对DTW算法的原理进行了分析,并对其进行了仿真实验,然后提出了一种改进的DTW算法,该算法相比传统的DTW算法,缩小了匹配区域,实验结果表明改进后的算法在不影响语音识别系统的识别率的情况下,可以显著的提高系统的识别速度,对于提高语音识别系统的实时性起到了积极的作用。最后设计了一个基于DTW的特定人孤立词语音识别系统,该系统集成了录音、信号观测、预处理、参数分析、特定人的孤立字语音识别等功能,并对此系统的识别率,实时性进行了测试,系统对0到9十个数字字符的识别取得了很好的识别效果,证明了此系统在识别率及实时性方面有着较好的表现,此外针对系统对于特定人与非特定人时的表现也做了对比分析,结果表明此系统对于特定人的语音识别具有更好的效果。