论文部分内容阅读
语音识别是解决机器“听懂”人类语言的一项技术。特别是在当前的人工智能领域,语音识别技术更是成为了人与机器对话的关键技术。因此,语音识别技术研究成为各国在语音领域的研究重点。目前,语音识别技术已广泛应用于语音拨号、语音控制、语音导航、语音文档检索等领域,受到了社会的一致认可。正是在此背景下,本文在基于隐马尔科夫模型进行语音识别研究时,首先分析了语音信号的预处理和特征提取过程,重点讨论了线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)两种语音特征提取方法。通过对语音信号的预处理和特征提取后,逐步分析出能表示语音信号本质的特征参数,并减少由于环境噪声和发音长短和强度不同等因素可能造成的语音识别错误。之后基于隐马尔科夫模型(HMM)进行语音识别,将HMM算法识别的结果作为候选词,最后采用BP神经网络来检测识别出的候选词是否正确,即判定是否属于与其相应的分类。经过实验验证知,采用基于HMM模型和DP神经网络相结合的孤立词语音识别能降低由于噪声干扰等因素造成HMM的模型识别错误,增强了语音识别系统的鲁棒性。