基于能量检测的复杂环境声音识别

来源 :福州大学 | 被引量 : 3次 | 上传用户：zj8972108

【摘要】

：

随着现代社会经济的不断发展,生态环境越来越受到关注,而包含丰富信息的环境声音又是生态环境中不可或缺的元素之一,因此对生态环境中各种不同的声音进行分析和识别,对生态环

【作者】

：

张小霞

【出处】

：

福州大学

【发表日期】

：

2014年01期

【关键词】

：

自适应能量检测非平稳噪声功率谱估计 Mel尺度的小波包分解子带倒谱系数高斯混合模型支持向量机双层分类模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着现代社会经济的不断发展,生态环境越来越受到关注,而包含丰富信息的环境声音又是生态环境中不可或缺的元素之一,因此对生态环境中各种不同的声音进行分析和识别,对生态环境的保护和可持续发展具有潜在的重大意义。现实生态环境中噪声无处不在也不可避免,本文将复杂背景噪声环境下的鸟类声音识别作为研究的切入点,提出了经过自适应能量检测(AED)后基于Mel尺度的小波包分解子带倒谱系数(MWSCC)特征结合高斯混合模型(GMM)与支持向量机(SVM)双层混合分类模型的环境声音识别方法,并将该方法推广到更一般化的复杂背景噪声下的环境声音识别。本文主要的研究工作包括如下三个方面：1)自适应能量检测：针对信号检测中常用的能量检测方法需要预先知道噪声方差以及固定检测阈值设定困难这两个问题,提出自适应能量检测方法。根据频率分布特点,先将带噪声音信号划分成子频带,对每个频带的声音信号进行非平稳噪声功率谱估计；再利用噪声估计中的前景声音存在概率设定能量检测概率,进而推导出具有针对性的能量检测阈值；最后根据估计的噪声方差与自适应的检测阈值,构成能量检测的自适应判决规则,对有用声音进行检测。2)改进的特征提取：针对Mel频率倒谱系数(MFCC)特征在复杂噪声环境下识别性能差的缺点以及环境声音具有多变性、多样性、非平稳性、非结构化等特点,提出基于Mel尺度的小波包分解子带倒谱系数(MWSCC)特征。并将前端的自适应能量检测(AED)与MWSCC特征提取相结合,得到AED_MWSCC,只对检测到有用声音信号的声音帧提取MWSCC抗噪特征,在优化声音分类识别性能的同时也降低了时间复杂度。3)双层混合分类模型：利用GMM适合于处理连续声音信号,SVM适合于进行声音分类的特点,提出GMM和SVM混合的双层分类模型,用第一层的GMM描述环境声音的特征分布进行粗分类,将第一层的GMM概率输出作为第二层SVM的输入,用SVM进行环境声音的精细类别划分,构建GMM_SVM双层混合分类模型对复杂环境声音进行分类与识别。本文对鸟类、哺乳动物类、昆虫类这3类30种的复杂环境声音进行研究及对比实验。实验结果表明,本文提出的AED_MWSCC结合GMM_SVM双层混合模型的声音识别方法,具有良好的噪声鲁棒性与分类识别性能,适用于复杂背景噪声下的环境声音识别。

其他文献

初中语文教师课堂倾听艺术研究

教师倾听艺术是教学艺术的重要组成部分,是教师复杂的生理活动和心理活动过程,要求教师听得巧妙,听得有效。《义务教育语文课程标准》(2011年版)中提出:“语文教学应在师生平

学位

初中语文教师倾听艺术问题对策

曲普瑞林治疗女童特发性中枢性性早熟29例疗效分析

目的:观察曲普瑞林治疗女童特发性中枢性性早熟(ICPP)的临床疗效,为ICPP的临床治疗提供依据。方法:应用曲普瑞林对29例ICPP女童进行治疗,观察治疗前与治疗后的第二性征、卵巢

期刊

性早熟曲普瑞林疗效

电影奇异空间中的CG场景视觉表现

电影这门艺术在现代社会生活中随着经济发展,已经成为人们精神生活中必不可缺的一部分。而其艺术表现形式及手法也随着科技的发展,电影的表现形式也随之多元化。动态视觉的形

学位

影视动画CG3D奇异空间

科学调控训练负荷实现体能训练最佳效果

借鉴现代训练理论、运动生理学理论,通过科学调控学员训练中的心率和外部表征的方法,对体能训练量和强度进行调控,实现学员体能达标训练的科学化、规范化,促进学员的身心素质

期刊

体能训练心率训练效果

论我国“按日计罚制度”的执法适用性

按日计罚制度兼顾了环境法律的严格性和可能给企业带来的经济负担这两方面的因素,彻底改变了“守法成本高,违法成本低”的错误观念.而且,我国《环境保护法》明确规

会议

连续SiC纤维增强Ti2AlNb基复合材料的制备及其力学性能研究

连续SiC纤维增强Ti2AlNb基复合材料（SiCf/Ti2AlNb）在航空动力系统的高温构件中有着巨大的应用潜力。目前采用基体涂层法制备SiCf/Ti2AlNb复合材料,并分析其微观组织、界面反应

学位

SiCf/Ti2AlNb复合材料成型工艺基体原始组织扩散障涂层界面反应室温轴向抗拉强度

基于非线性振动-声场调制技术的受载板件在线健康监测关键技术研究

板壳类金属结构是各类装备中常见的结构形式,对该类结构进行健康监测是实现装备结构完整性监测的重要内容。疲劳裂纹是板壳类金属结构的主要损伤形式之一。实现疲劳裂纹的早

学位

结构健康监测在线早期诊断非经典非线性超声粗糙接触界面非线性振动-声场调制损伤指数载荷效应疲劳裂纹扩展塑形致闭效应损伤跟踪性能评估

污泥生物炭环境风险评价及其对灰钙土热物理性质的影响研究

污泥作为一种具有可资源化和环境危险性双重特征的固体废弃物,如何妥善处理使其环境风险降低的同时充分利用其中的有益组分是未来亟待解决的问题。污泥热解技术是目前最具潜

学位

污泥生物炭重金属环境风险土壤热性质

基于GMM的办公室环境下两类异常声音识别的研究

由于科学技术的持续发展,特别是信息化和网络化的高速发展,人们的生活水平得到了巨大的改善。与此同时,随着城市化进程的加速,信息安全问题已经成为了社会关注的焦点,无论是

学位

异常声音识别音频监控嵌入式高斯混合模型梅尔频率倒谱系数

一节“惯性”课五种“引入”法

教学是一门科学,更是一门艺术。要吸引学生的注意力,活跃课堂气氛,就要讲究教学艺术。结合平时的物理教学实践,笔者总结出了五种新课引入的方法。 Teaching is a science, i

期刊

教学艺术物理教学新课引入法

基于能量检测的复杂环境声音识别

其他学术论文