论文部分内容阅读
语音端点检测是从一段包含语音的信号中准确地找出语音部分的起止点,实现语音数据和背景噪声的分离,为后续语音识别系统提供有效的数据。经过专家学者的多年研究,语音端点检测技术在实验室等安静环境中已经取得了令人满意的结果,但在现实环境中由于各种噪声的引入导致端点检测的性能显著下降,因此噪声环境下语音端点检测的研究具有重要意义。现有的语音端点检测的方法大体上可以分为两类:一类是基于特征的方法,即通过提取能够体现语音信号和噪声信号差异的特征,比较这些语音信号的特征值和设定阈值,从而正确区分语音部分和噪声部分,达到语音端点检测的目的,这种方法运算量小,原理简单易懂,因此被人们广泛应用,但是随着信噪比的降低,语音信号的特征一般都会受到噪声的影响,检测正确率有所下降;第二类是基于统计模型的方法,这种方法需要对语音信号和噪声信号的模型参数进行估计,此方法虽然能够很好的进行检测,但运算量大,复杂度高,难以达到语音信号系统实时性的要求。本文在研究几种基于特征的语音端点检测算法的同时,进行了仿真实验,给出了实验结果,在此基础上给出了一些相应的改进,以提高噪声环境下端点检测算法的鲁棒性。内容概括如下:1.为了克服传统双门限语音端点检测方法随着噪声环境变恶劣检测性能变差的问题,本文首先对带噪语音信号进行小波去噪处理,在此基础上使用决策树理论对传统方法进行改进,并通过仿真实验表明了在几种特定噪声环境中此方法具有较好的鲁棒性。2.对于自适应选择子带谱熵端点检测算法,首先分析了带噪语音信号的噪声水平,然后根据所估计的环境信噪比情况来决定是否有去噪的必要性,从而不仅能确保在信噪比低的环境中减小噪声对语音信号的影响,并且在信噪比高的环境中能避免一些无意义的操作(例如在实验室环境中不需要进行去噪处理),精简算法。去噪后对信号自适应子带功率谱密度的计算公式进行了修正,并通过MATLAB仿真实验证明了修正后的公式能够更好地突出自适应子带方法的优点,获得更能够代表语音本质的特征。与其他语音端点检测的方法相比,该算法在低信噪比的噪声环境中具有更高的鲁棒性。3.本文还将基于减法聚类得到K-均值聚类初始聚类中心以及聚类数的方法应用于语音端点检测中,并对这一算法进行了仿真实验与分析。