论文部分内容阅读
本文在对语音识别相关理论研究的基础上,应用VC++编程技术构建了实时语音识别软件系统,并在该软件系统上对汉语非特定人连续数字语音识别进行了一系列实验,取得了较好的效果。本文首先介绍语音识别技术国内外发展状况,分析了汉语连续数字语音识别中面临的困难,在此基础上阐明本课题的研究背景和意义。其次,讨论了语音识别系统的基本原理及构成模型。详细介绍了语音信号分析技术以及隐马尔可夫模型(Hidden Markov Model,HMM)等相关理论,为语音识别软件系统的实现和语音识别实验的开展奠定了相关的理论基础。再次,应用VC++软件编程技术构建了实时语音识别软件系统。在软件系统构建过程中充分考虑了软件的适应性和易用性,通过多线程多缓冲技术实现了声卡实时采集与回放,网络实时接收与发送等功能;友好的人机界面可以对语音信号进行实时观察与分析,对识别结果进行直观显示等;在识别处理方面,深入研究并借鉴了英国剑桥大学的语音识别系统HTK的开源代码,保证了识别系统的先进性。最后,在本文编制的软件系统上对汉语非特定人连续数字语音进行了相关的识别实验并对识别结果进行了分析,取得良好的效果。同时对语音识别系统进行了全面的总结,并对今后的工作进行了展望。