环境声音评测与分类的方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:nastar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人们对生活质量的要求日益升高,健康舒适的居住环境成为人们关注的重点,环境噪声投诉占环境投诉的比例也明显升高。然而,如今的噪声监测只有声压级一个指标,忽略了声源这一对人耳有重要影响的因素,相同声压级的音乐声与汽车噪声相比,人们显然对前者有更高到的接受度。针对这一现象,本文借鉴声音景观理论,采用主观评价的方法对不同声源组合的噪声划分等级,并利用深度学习算法识别出环境声音的噪声等级,给环保工作者在噪声监测工作中以更加科学的指导。
  提取合适的特征是进行环境声音分类的首要任务。与其他音频信号相比,环境声音比较复杂,一条声音片段中会交替出现多种声源。单使用时域的特征难以取得好的分类效果,梅尔频率倒谱系数是频域上最常用的特征,然而,它对噪声比较敏感,不适用于复杂的环境声音分析。对数梅尔声谱图结合了时域和频域的特征,又符合人耳的听觉特性,基于深度学习的分类方法有望取得好的环境声音分类效果,因此,本文提取的环境声音特征为对数梅尔声谱图。
  模型的选择对环境声音分类结果具有重要的影响。深度学习方法比传统的信号识别方法更具优势。目前,基于深度学习的声音分类方法大多借鉴图像处理技术、语音识别方法和自然语言处理方法,采用卷积神经网络或者循环神经网络作为分类模型。卷积神经网络能高效的获取图像的局部特征信息,却难以利用上下文信息,循环神经网络能获取上下文信息,但是网络结构复杂,效率较低。通过分析声音信号的特性,本文结合卷积神经网络和循环神经网络的优点,设计卷积循环神经网络作为分类模型,按照局部特征、全局特征、上下文信息的顺序进行特征提取,进而更好的实现声音分类。鉴于对数梅尔声谱图的频率较高,卷积神经网络容易丢失平移不变性,其平移不变性的丢失主要是由下采样引起的,为了缓和这一现象,本文引入模糊池化来改善最大池化层。在环境声音信号中,背景信号比较复杂,且占较多比例,本文引入门控线性单元作为卷积神经网络的激活函数,尽量忽略背景信息,提取更有用的特征。
  本文主要是在深圳市各区域采集的环境声音上进行实验,并对基本卷积循环神经网络模型与改进后的模型进行对比分析,实验结果证明了本文提出的改进方法的有效性。
其他文献
CRISPR-Cas是广泛存在于古菌和细菌中的获得性免疫体系,由小RNA介导Cas蛋白保护它们的宿主细胞免受移动遗传因子(mobile genetic element, MGE)的入侵。这一原核生物免疫系统可分为两大类,六个不同的类型。研究表明,I,II,V型CRISPR-Cas系统编码小RNA介导的靶标DNA干涉活性,VI型系统编码小RNA介导的靶标RNA和靶标RNA激活的RNA干涉活性,然而I
基因毒性抗生素阿嗪霉素B(azinomycin B)是从链霉菌(Streptomyces sahachiroi)中分离到的杂合聚酮-非核糖体多肽类抗生素,含有一个高活性的环氧基团和一个罕见的氮杂双元环,可亲核攻击5′-d(PuNPy)-3′序列中嘌呤碱基的N7位形成DNA链间交联,使得该抗生素具有强烈的细胞毒性和广谱的抗癌细胞活性,具有开发成为新型肿瘤化学治疗剂的潜力。阿嗪霉素B是一种强烈的DNA
学位
研究背景与目的:甲型流感病毒依据其致病性强弱分为高致病性或低致病性,以往爆发的H5N1,H7N9和H7N7高致病性甲流疫情,死亡率高达30%以上。而低致病力甲流病毒pdm09H1N1爆发,感染患者大部分可以自行痊愈,死亡率低于0.05%。高致病性甲流的致病机制一直是研究的热点,大量研究发现免疫系统对病毒感染的过度反应,是甲型流感病毒的主要致病机制。高致病性甲型流感病毒可以引发“细胞因子风暴”,宿主
DNA测序技术的发展有着短暂且丰富的历史,在短短的40多年中有着众多飞跃式的发展。从Sanger的电泳法测序技术,以高成本、低通量、长读长、高精度等特点打开生物测序的大门;到NGS大规模平行测序,以低成本、高通量、短读长、高精度等特点成为生物测序的中流砥柱;再到目前正引领新潮流的单分子实时合成测序如PacBio和Nanopore,以高通量、超长读长、低精度等特点开创生物测序的新时代。DNA测序技术
学位
结核分枝杆菌(Mycobacterium tuberculosis,Mtb)是结核病(Tuberculosis)的胞内致病菌,其在人体内的宿主细胞主要是巨噬细胞。Mtb和宿主之间蛋白-蛋白的相互作用在感染和免疫中起着重要作用。本研究利用Mtb强毒株H37Rv和弱毒株H37Ra分别刺激巨噬细胞,提取巨噬细胞全蛋白与Mtb全蛋白芯片相互作用,筛选出了283个差异蛋白,这些差异蛋白可能与Mtb的毒性相关
端粒是真核生物线性染色体末端的核糖核蛋白结构。因为其结构的特殊性,位于端粒或亚端粒区域的基因通常处于转录表达沉默状态。在裂殖酵母中,由dsDNA结合蛋白Taz1,ssDNA结合蛋白Pot1,端粒酶招募蛋白Ccq1以及桥连蛋白Rap1-Poz1-Tpz1构成的保护复合物-Shelterin在染色体末端端粒稳态的维持、异染色质状态的维持以及末端结构的保护等过程中有重要作用。这些蛋白在结构和功能上与人源
学位
光电化学电池将太阳能转化成电能和化学能(如氢能),能有效地解决能源和环境污染问题,显示了可持续发展的前景。本文研究了可将太阳能转换成电能的液结太阳能电池和可将太阳能转换成化学能的光电解电池。纳米TiO薄膜电极作为上述电池的光阳极,通过优化获得了较高光电压和光电流的太阳能电池,并且利用太阳能电池得到的电能,作为光电解池的偏压,光解水制得氢气;另外还设计了新型的离子隔膜双室光电解池,无需偏压即可制得氢
复杂电磁环境下的卫星通信链路受到来自低轨卫星或地面站的特定干扰后,会降低其通信的有效性和可靠性。因此,在干扰存在的情况下提高通信的可靠性和有效性是卫星通信领域的研究热点和难点问题。本文从深度学习的角度入手,把深度神经网络结构与LDPC码的并行迭代译码结合起来,来研究在音调干扰信号存在的情况下基于神经网络的译码算法。  本文首先对音调干扰信号进行了分析,并研究了音调干扰信号的时域特征以及频域特征,建
学位
RTK(Real-time kinematic)是一种载波相位差分技术。该技术是通过利用两个观测站载波相位观测值进行实时差分处理的一种方法,将基站得到的观测数据发送到用户站,实现求差解算坐标。然而,RTK定位是以用户站和基站误差基本相同为基础的,用户必须位于基站10-15公里范围内。随着基线的增长,GPS误差的空间相关性会渐渐减弱,导致定位精度降低。因此,为了能够实现高精度RTK定位作用于更长的距
舌诊是中医中的一项重要诊断方法。中医认为,舌头与人体的脏器密切相关,人体的某些疾病可以从舌头反映出来。因此,通过舌图像诊断疾病的技术一直受到广泛的关注,大量的计算机化舌诊技术被提出,然而由于不同疾病患者的舌图像之间的差异非常细微,所以如何准确地对不同疾病的舌图像进行分类是一项难题。而先前的计算机化舌诊技术都是手动提取舌象的特征,如颜色、纹理和红点,然后使用传统的分类器对这些特征进行分类,而手动的特
学位