论文部分内容阅读
语音检测是指从一段包含语音的信号中自动地检测出语音存在时段的一门技术,也称为语音活动检测。它是语音信号处理中的重要环节,广泛地应用于多个研究领域,如语音编码、语音增强和语音识别等。目前,现有的语音检测方法在高信噪比噪声环境下检测效果比较理想,然而在低信噪比噪声环境下,其检测效果很大程度地下降。因此,低信噪比环境下的鲁棒语音检测方法研究具有重大意义。本文主要对基于机器学习的语音检测方法进行研究,在研究和分析现有的一些检测方法的基础上,对两种语音检测方法进行了改进,达到在低信噪比环境下提高语音检测性能的目的,具体工作和创新如下:(1)基于鲁棒特征的加权学习语音检测该方法针对基于谐波频率分量多观测似然比测试的语音检测方法所存在的一些问题进行了改进。针对噪声方差是计算语音检测似然比的关键,采用了无偏最小均方误差的方法进行噪声估计,提高了似然比计算的准确性;针对在低信噪比噪声环境下,浊音帧的谐波谱峰受到噪声干扰很大,不能有效地提高原有多帧似然比的总得分的缺点,提出了一个新的特征:基于长时谱峰的似然比几何均值,并将此特征与原有的多观测特征向量组合成一个新的特征向量,使用基于最小分类错误可区分训练方法对新特征向量进行加权,以此来改进语音检测的决策规则,这样消除了等权值模型所存在的缺陷。实验结果表明,该方法提高了对弱语音帧的检测,从而提高了语音检测的检测性能。(2)基于噪声和信号分类的语音检测由于基于信号分类的语音检测方法在检测模型构建时是由多噪声环境的混合含噪语音训练得到的,它没有考虑到噪声类别对语音检测的检测性能也存在一定的影响。因此,本文引入了噪声分类方法,将其作为语音检测方法的第一步,以此来提高检测性能。采用了感知小波包变换的方法来进行噪声特征提取,提高了噪声分类的准确性。针对二元分类问题需要可分性高的信号特征的要求,使用了鲁棒性高的多窗谱MFCC进行信号特征提取。实验结果表明,该方法有效地提高了语音检测的检测性能。