论文部分内容阅读
语音信号因为其具有直接、高效、方便的优点,作为传递信息的方式应用于很多领域。然而,在使用语音进行信息表达的同时,实际环境中的噪声会无法避免的对其产生影响。噪声不仅影响语音接收者在听到语音时的舒适度,还会影响各种语音处理应用的性能。语音增强就是将带噪语音中的噪声部分尽可能的祛除,还原出纯净语音信号,从而减少噪声对语音清晰度和可懂度的影响。对含噪语音进行增强处理时,准确估计噪声的特性对语音增强算法的效果有着至关重要的作用。噪声估计过小,噪声会去除不干净而产生残留;噪声估计过高,将损伤纯净语音成分从而造成语音失真。因此,研究噪声估计算法以提高噪声估计准确性有着十分重要的意义。本文首先介绍了几种代表性的噪声估计算法,并对其进行比较和实验仿真。然后以改进的最小值控制递归平均(Improved Minima Controlled Recursive Averaging,IMCRA)算法为基础,通过对算法中最小值搜索存在时延的问题进行分析,提出了改进的噪声估计算法,提高了噪声估计的准确性并使增强语音的质量得到改善。在改进噪声估计算法的基础上,将基于改进算法的语音增强应用于语音识别之中,设计开发了一个语音识别系统。主要工作如下:(1)针对IMCRA噪声估计算法在噪声水平升高时存在跟踪时延和估计不准确的问题,利用连续最小值跟踪算法取代IMCRA算法中的最小值统计算法,从而使最小值跟踪不受窗长约束而减少跟踪时延;并提出一种基于语音存在概率的偏差补偿函数模型,对各个频带进行不同程度的偏差补偿。对IMCRA算法做以上两点的改进,提出一个噪声估计的改进算法。对改进算法和IMCRA算法做比较实验,分析实验结果可知,与原始算法相比,改进算法在平稳和非平稳噪声环境中,都能有效提高增强后语音的质量。(2)将基于改进噪声估计算法的语音增强系统应用到语音识别场景之中,使用JAVASwing设计开发了一个语音识别系统,实现了实时录制语音,对语音进行增强处理、识别语音内容等功能,体现了语音增强系统的实用价值。