论文部分内容阅读
随着现代社会经济的不断发展,生态环境越来越受到关注,而包含丰富信息的环境声音又是生态环境中不可或缺的元素之一,因此对生态环境中各种不同的声音进行分析和识别,对生态环境的保护和可持续发展具有潜在的重大意义。现实生态环境中噪声无处不在也不可避免,本文将复杂背景噪声环境下的鸟类声音识别作为研究的切入点,提出了经过自适应能量检测(AED)后基于Mel尺度的小波包分解子带倒谱系数(MWSCC)特征结合高斯混合模型(GMM)与支持向量机(SVM)双层混合分类模型的环境声音识别方法,并将该方法推广到更一般化的复杂背景噪声下的环境声音识别。本文主要的研究工作包括如下三个方面:1)自适应能量检测:针对信号检测中常用的能量检测方法需要预先知道噪声方差以及固定检测阈值设定困难这两个问题,提出自适应能量检测方法。根据频率分布特点,先将带噪声音信号划分成子频带,对每个频带的声音信号进行非平稳噪声功率谱估计;再利用噪声估计中的前景声音存在概率设定能量检测概率,进而推导出具有针对性的能量检测阈值;最后根据估计的噪声方差与自适应的检测阈值,构成能量检测的自适应判决规则,对有用声音进行检测。2)改进的特征提取:针对Mel频率倒谱系数(MFCC)特征在复杂噪声环境下识别性能差的缺点以及环境声音具有多变性、多样性、非平稳性、非结构化等特点,提出基于Mel尺度的小波包分解子带倒谱系数(MWSCC)特征。并将前端的自适应能量检测(AED)与MWSCC特征提取相结合,得到AED_MWSCC,只对检测到有用声音信号的声音帧提取MWSCC抗噪特征,在优化声音分类识别性能的同时也降低了时间复杂度。3)双层混合分类模型:利用GMM适合于处理连续声音信号,SVM适合于进行声音分类的特点,提出GMM和SVM混合的双层分类模型,用第一层的GMM描述环境声音的特征分布进行粗分类,将第一层的GMM概率输出作为第二层SVM的输入,用SVM进行环境声音的精细类别划分,构建GMM_SVM双层混合分类模型对复杂环境声音进行分类与识别。本文对鸟类、哺乳动物类、昆虫类这3类30种的复杂环境声音进行研究及对比实验。实验结果表明,本文提出的AED_MWSCC结合GMM_SVM双层混合模型的声音识别方法,具有良好的噪声鲁棒性与分类识别性能,适用于复杂背景噪声下的环境声音识别。