论文部分内容阅读
语音识别是指将输入的语音信号转化为相应的文本或命令,让机器听懂人类的语言。目前,语音识别系统在安静的实验室环境中取得了很好的效果,但在现实应用中,由于背景噪声的干扰,致使训练环境与识别环境之间出现了不匹配,这种不匹配严重降低了系统的识别性能,鲁棒性语音识别的目的就是减小这种不匹配对识别系统造成的负面影响。目前提高语音识别系统鲁棒性的技术主要从信号空间,特征空间,识别模型空间三个方面进行抗噪声处理。本文主要针对加性噪声的影响,给出一种基于组合去噪方法的鲁棒性识别技术。本文首先在信号空间,针对小波阈值去噪法,硬阈值函数处理后信号易产生振荡,软阂值函数处理后信号失真大等问题,综合软硬阈值函数的优点给出了一种改进的阈值函数,改进的阈值函数不仅连续性好,而且不存在恒定的偏差。并针对语音信号和噪声在不同小波尺度下具有不同的奇异性,即语音信号的小波变换系数的模值随尺度的增加而增加;噪声的小波变换系数的模值随尺度的增大而减小,给出了一种改进阈值规则。实验表明,经本文新方法处理后的信号的信噪比有了较大升高,识别系统的鲁棒性能得到一定改善。其次,在特征空间,传统的美频率倒谱系数(MFCC)是一种符合人耳听觉特性的语音特征参数,在提取MFCC的过程中使用离散傅里叶变换,但离散傅里叶变换在信号的时频空间使用固定的分析窗,不符合语音信号的非平稳特性,而小波变换具有多分辨率分析特性,更符合人耳的听觉特性。本文基于小波分析给出了一种改进的MFCC参数。实验表明,比起原来的MFCC,这种改进的特征参数较大地提高了系统的识别率,具有更强的鲁棒性。最后,由于从单一方面提高语音识别系统鲁棒性取得的效果有限,本文结合信号空间和特征空间的抗噪声技术,并引入小波变换技术,给出了一种基于小波分析的组合去噪法用于提高语音识别系统在噪声环境中的鲁棒性。在实验验证部分,首先基于本文的组合去噪方法搭建了一个小词汇量、孤立词的语音识别系统,然后对几种不同信噪比(噪声为高斯白噪声)汉语数字0-9的发音信号进行识别,对比分析本文基于组合去噪法的鲁棒性语音识别系统与传统识别系统的结果,证明了本文提出方法的有效性。