论文部分内容阅读
在当代各种各样的通信系统中,语音通信业务一直是必不可少的,如何在一段语音信号中将有效的语音和无效的噪声分离,多年来,这个问题一直受到众多学者的关注。所谓的语音端点检测就是指从一段语音信号中准确的找出语音信号的起始点和结束点,它的目的是为了使有效的语音信号和无用的噪声信号得以分离。它作为一种语音信号预处理技术,在实际应用中起着非常重要的作用,由于消除了背景噪声的影响,语音处理的精度得以提高。另外它的应用范围十分广泛,在语音识别、语音增强、语音编码、回声抵消等系统中都是必不可少的环节。经过许多专家学者多年的研究,已经提出了许多语音端点检测的方法,这些方法大体上分为两大类。一类是基于阈值的方法,这种方法就是根据语音信号和噪声信号的不同特征,提取每一段语音信号的特征,然后把这些特征值与设定的阈值进行比较,从而达到语音端点检测的目的,最传统的一些算法例如短时能量,过零率等就属于这一类。另一类方法是基于模式识别的方法,需要估计语音信号和噪声信号的模型参数来进行检测。基于阈值的检测方法原理简单,运算方便,从而被人们广泛使用,但是由于在信噪比降低的情况下,语音信号容易被噪声淹没,所以它的检测效果会变的很差,而基于模式识别的方法又由于自身复杂度高,运算量大,很难被人们应用到实时语音信号系统中去。本课题将子带自适应选择谱熵检测算法以及自适应滤波技术相结合,达到先滤波再检测的目的,和其他语音端点检测算法相比,该算法具有较高的鲁棒性,在信噪比降低的条件下能比较准确的进行语音端点检测。在本课题中应用MATLAB软件对本文中选用的语音端点检测算法进行仿真,表明该算法具有较好的鲁棒性。选用TMS320VC5416 DSP芯片作为核心处理器以及TLV320AIC23作为Codec芯片来研究语音端点检测的硬件系统。