论文部分内容阅读
嵌入式系统具有成本低、体积小、能耗低等优点,因此基于嵌入式硬件平台的语音识别系统具有很好的应用前景。矢量泰勒数(VTS:Vector Taylor Series)特征补偿是一种常用的语音识别特征补偿方法,其具有较好的鲁棒性,能够有效地提高系统在较低信噪比环境下的识别率。然而VTS特征补偿由于涉及到循环、迭代和指数运算,计算复杂度高、计算量大,因此本论文首先对基于VTS特征补偿的语音识别算法进行了优化,特征补偿中采用双层高斯混合模型(GMM:Gaussian Mixture Model)代替原先的单层GMM,并基于ARM A8平台,优化算法结构,大幅度降低识别系统的计算量。同时针对多模型的VTS方法,提出了基于ARM A8平台的优化多噪声环境匹配的VTS估计方法,提高识别系统对复杂声学环境的适应能力。论文主要工作如下:(1)基于ARM平台的语音识别系统结构概述。研究分析了语音识别系统的基本流程和方法,包括预处理、端点检测、特征提取以及隐马尔科夫模型(HMM:Hidden Markov Model)匹配几个主要步骤。(2)在ARM平台上实现了基于双层GMM结构VTS特征补偿的孤立词识别算法在ARM平台上的实现。VTS特征补偿算法是基于单层GMM结构的,单层VTS特征补偿模块的运行时间占整个孤立词识别系统运行时间的大部分。本文分别在MATLAB平台和ARM平台上对原先单层GMM结构的VTS特征补偿方法进行了分析,讨论了 GMM混合数对噪声参数估计、纯净语音特征向量映射以及整体VTS特征补偿模块时间花费的影响,根据仿真测试结果,给出了双层GMM结构的VTS特征补偿算法,并给出了双层GMM结构的最佳混合数。此外,通过分析ARM平台和MATLAB平台上的VTS模块运行时间的差异,本文还对基于ARM平台上的映射部分做了代码优化。基于ARM平台上的仿真结果表明,基于优化后的双层GMM结构的语音识别算法,计算量大幅降低,同时识别性能也与原先单层GMM结构相当。(3)在ARM平台上实现了基于双层GMM结构和多噪声环境模型的孤立词识别系统,并进行了优化。实验室原先提出的基于多环境模型的VTS语音识别算法采用白噪声与纯净语音混合生成多种信噪比环境下的模型,对于白噪声下的测试语音有较好的识别效果,但对于其他类噪声语音识别效果并不理想。针对这一问题,本文引入其他类型噪声下的训练模型,同时对训练模型所需的信噪比类别进行分析,选择典型环境下的多噪声模型。基于MATLAB的仿真实验和ARM平台的测试,都表明优化后的多噪声环境系统提高了系统在多种噪声环境下的识别率,同时ARM平台上的测试表明本文的优化方法不仅减少了系统的存储量,还减少了最佳模型匹配部分所花费的时间。