论文部分内容阅读
语音端点检测技术,是指对输入语音处理系统的一段纯净或含噪语音信号进行语音段的起止端点的标记,它是各类语音处理系统中的一个重要的前期预处理环节。高效的端点检测技术不仅能剔除非语音段的信号从而削弱对后续处理环节的干扰,还可以降低整个系统中待处理的数据量,进而使运算时间得以减少。在现实生活中,很少存在安静的采集环境,所以获取的语音信号大多是带有不同背景噪声的,在这种情况下,对语音端点检测技术的研究将对语音处理系统的稳定性和实用性大有益处。有效的语音端点检测技术可以分为两类研究方法:一类是基于统计模型的研究方法,此类研究方法检测效果良好,但由于需要多次试验进而统计得出语音信号的模型参数,使复杂度变高的同时加大了运算量,所以严重影响了语音信号处理系统的实时性;另一类研究方法,是通过提取能够突出语音段且抑制噪声段信号的某一种特征值并将其与相应的阈值比较,从而切割出语音段部分,此方法称为特征提取法,这类方法虽然运算量普遍较小,但相应的语音信号的特征值会随着信噪比的降低而难以区别语音与非语音段,进而影响检测结果的正确率。本文通过参考几种基于特征提取的语音端点检测方法的研究,在此基础上提出了相应的改进算法,以提高噪声背景下的端点检测的准确率。主要内容概括如下:1.提出一种改进的以交叉熵大小为判决准则的算法,对噪声估计部分采用语音存在概率的算法来估计背景噪声功率谱,根据带噪语音与估计噪声的子带能量之间的交叉熵特征值对输入的语音进行分类,与原始算法相比,改进算法在低信噪比的噪声环境中更具有鲁棒性。2.针对经验模态分解的模态混叠问题,提出基于集合经验模态分解与Teager峭度相结合的语音端点检测算法。利用集合经验模态分解算法将输入语音信号分解为多个本征模态函数,计算每个本征模态函数的Teager能量,并对本征模态函数的Teager能量的峭度进行根的幂函数计算,对提取的信号特征信息进行顺序统计滤波,寻找合适阈值,实现低信噪比条件下的语音段的检测工作。3.在基于压缩感知观测序列语音能量的检测方法基础上,引入信号子空间去噪方法,对带噪语音信号首先经过去噪处理,再进行观测序列语音能量的估计,与原始算法相比,端点检测准确率有所提高。