论文部分内容阅读
语音识别是实现人机语音通信的关键技术,是未来信息技术领域的重要科技发展方向。目前,语音识别技术已经得到了广泛应用,但是,诸如声控智能玩具,声控电话,声控家电产品这样的语音识别产品在人们的日常生活中还很少。这主要是由于价格、成本、识别效率、系统可移植性等因素影响。在此背景下,本文以实用化为目的,重点对孤立词、特定人、小词汇量语音识别系统研究,为开发声控智能电子产品的识别内核奠定基础。
本文首先介绍了语音识别的研究和发展状况,然后循着语音识别系统的处理过程,介绍了语音识别的各个步骤,并对每个步骤可用的几种方法在实验基础上进行了分析对比。研究了语音信号的预处理和特征参数提取,包括语音信号的数字化、分帧加窗、预加重滤波、端点检测及时域特征向量和变换域特征向量。其中端点检测采用双门限法。通过实验比对特征参数的选取,采用12阶线性预测倒谱系数作为识别参数。详细分析了特定人孤立词识别算法,选定动态时间弯折为识别算法,并重点介绍其设计实现。
在VisualC++环境下,设计并实现一个特定人、孤立词语音识别系统,系统可以识别数字0~9等简单指令。该系统还具备演示、学习功能,可以演示语音处理的各个步骤,还可以根据需要添加新的指令。
最后,重点从端点检测算法和动态时间弯折识别算法对系统进行改进。实验表明,改进后的系统识别率有很大提高,达到95%,为进一步开发实用性语音识别系统产品打下了基础。