论文部分内容阅读
在目前存在的多种语音增强算法里,谱减法凭借着语音增强效果较好、算法复杂度适中和较容易实时处理实现而得到了广泛的应用。谱减法通过预先估计噪声谱的幅度,再从原始带噪语音中减去噪声谱幅度而相位不变的处理方法得到增强后的语音。由于对噪声谱进行准确估计的难度很大,谱减算法为了得到较高的处理后语音信噪比,往往对噪声谱采取了过减的方法,这样就不可避免地引入了额外的失真-音乐噪声。由于掩蔽效应的存在,当语音强度较大时,一部分噪声会被语音掩蔽掉,这一部分噪声便不必要进行处理了。因此在现有的谱减法语音增强算法里,有些算法应用了掩蔽效应以便减少残留的音乐噪声。但是,掩蔽模型的引入对语音增强效果的影响,并没有得到全面的研究。表现在掩蔽量的计算上采用最保守的掩蔽曲线。各个临界频带的互相掩蔽影响也采用了固定的矩阵。而实际上,不同的人群的听觉特性是不一样的,现今的研究成果也表明了掩蔽阈值与很多因素如生理特点,种族因素等有关,不能一概而定。因此,在应用掩蔽效应的算法里面,掩蔽量大小是否应该针对不同的情况使用不同的掩蔽曲线?例如,象AC-3的编码算法一样,推荐使用不同的掩蔽曲线组合。
本文首先总结了现在的各种语音增强算法,再详细地介绍了谱减法及其改进的算法以及常用的噪声谱估计算法。对两种最常用的噪声估计算法-VAD噪声检测估计和基于最小值统计特性的噪声估计法,分别运用间接和直接的方法把掩蔽效应引入语音增强算法中,运用不同的掩蔽阈值偏移量计算了增强前后的信噪比(SNR)并进行了主观试听实验。客观计算结果表明:掩蔽效应的运用对语音增强效果的影响是很大的,在不使用掩蔽效应的情况下,最优最小统计值法语音增强的SNR增加很多,从而可能引入更大的音乐噪声。但无论对VAD噪声检测估计法和基于最小值统计特性的噪声估计法,掩蔽阈值偏移量的少量变化对SNR的影响都不是很大,说明掩蔽阈值与噪声幅值、语音幅值相比,是一个很小的量,掩蔽阈值的少量改变不会对SNR产生大的影响。主观试听的结果表明了:在不同的噪声类型情况下改变掩蔽模型所得到的主观试听结果有所不同,在宽带噪声如白噪声情形下,加大或减少掩蔽阈值较多时,多数受试者认为语音质量变差。而在人声噪声的情形下,加大掩蔽阈值时,多数受试者认为语音质量变好。本文同时对各个临界频带互相掩蔽而得的传播函数进行了计算分析,由于传播函数主要由临界带间的相互掩蔽曲线的上升斜率和下降斜率所决定,因此当改变这些斜率时,语音增强的效果也有可能发生改变。但最终信噪比计算结果和主观试听结果表明:对所选用的语音信号和噪声信号,传播函数斜率的变化并未带来可见或可闻的变化。