多通道声源跟踪及分离技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:heliuer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音应用和人工智能的发展,智能机器人和智能音频设备越来越多地走进了人们的生活。在使用时,这些音频设备往往需要工作在复杂的声学环境中,说话人可能会随机地移动,目标说话人的语音可能会淹没在其他说话人的语音中,还可能会遭遇复杂的背景噪声和混响。在这样的环境中,音频设备不能没有机器听觉技术的帮助,而多通道声源跟踪及分离技术就是这一领域重要的组成部分。本文主要研究了多通道声源跟踪及分离技术,并针对传统方法存在的缺陷做了改进,完成的工作内容如下:
  (1)本文研究了基于粒子滤波算法的通用声源跟踪框架。其中的定位算法采用相位加权可控响应功率算法(SteeredResponsePower-PhaseTransform,SRP-PHAT),该传统算法在低信噪比、高混响环境中的定位精度较差,从而影响跟踪效果。针对这一问题,本文将一种基于掩蔽值的加权方式引入通用声源跟踪框架,提出了改进的声源跟踪算法。与传统的相位加权方式不同的是,改进算法使用深度神经网络(DeepNeuralNetwork,DNN)为每个时频单元估计一个相位敏感掩蔽值(PhaseSensitiveMask,PSM)并将其作为该时频单元的权重,使携带纯净相位信息的时频单元获得更高的权重,降低被噪声和混响主导的时频单元对定位结果的影响。仿真结果表明,改进的声源跟踪算法在低信噪比、高混响环境中获得了比传统跟踪算法更好的跟踪效果。
  (2)本文研究了几何源分离(GeometricSourceSeparation,GSS)算法及其后置滤波器。研究发现,当遭遇无指向性背景噪声或信干比较低时,单纯的GSS算法的分离效果会急剧恶化。针对这一问题,本文设计了一种基于DNN的后置滤波器,用于增强GSS算法的输出结果。使用GSS算法的输出音频作为DNN后置滤波器的训练数据,使其能够直接建模从GSS输出结果到纯净声源的映射,同时实现消除残余噪声和抑制通道泄露的作用。仿真结果表明,本文提出的基于DNN的后置滤波器相比于传统后置滤波器取得了更好的分离效果。
其他文献
一氧化二氮(N2O)是一种重要的温室气体,全球约75%的N2O排放来自于农业土壤。设施菜地由于其高氮肥投入等原因,被认为是土壤N2O排放的热点。相比化学肥料,有机肥具有缓解土壤酸化、改良土壤物理结构和刺激土壤微生物活性等功能。然而以往关于有机肥对设施菜地N2O排放的影响观点不一,且缺乏针对氮循环相关功能微生物以及它们如何影响土壤N2O排放的研究。本研究以有机肥及设施菜地为研究对象,共为两个部分。第
多环芳烃(Polycyclic aromatic hydrocarbons,简称PAHs)是一类持久性有毒有机污染物,土壤中的PAHs可以通过多种途径进入人体,对人们的生命健康造成严重威胁。目前多种化学修复技术应用于降解土壤PAHs,其中硫酸根自由基高级氧化技术(SR-AOPs技术)具有降解时间短,应用范围广,绿色无毒等特点。但SR-AOPs技术应用于复合PAHs污染场地的修复时,效果不太理想,究
碳酸盐的微生物矿化是自然界普遍发生的一种生物地球化学现象。对碳酸盐的微生物矿化机理进行研究具有多方面的意义,例如,有助于丰富和完善土壤形成理论,固定大气CO2,修复和加固石质文物、混凝土材料的坝库等。近些年来,科研工作者针对微生物矿化过程和机理开展了大量卓有成效的工作,但目前对机理的认识还很肤浅。研究者对Mg2+在碳酸钙形成过程中的作用给予了一定程度的关注,而对与Mg2+同一主族的Sr2+和Ba2
木聚糖酶是广泛存在于自然界中的一种生物酶,其主要来源细菌、放线菌及真菌等微生物。木聚糖酶通过水解的方式作用于寡糖和多糖的糖苷键,使其降解为低聚木糖。木聚糖酶在造纸业、食品业、饲料工业及生物能源等领域有着广泛的应用。正是由于木聚糖酶所展现出的广阔工业应用前景,使得越来越多的科研人员投身于木聚糖酶的开发和研究工作。随着基因工程、蛋白质工程、生物信息学、酶学、晶体学和计算生物学技术的发展,不同酶学特征的
学位
全球变化影响着植物的生长、发育、繁殖和分布。植物入侵作为全球变化因子的重要组分之一,也会受到其他全球变化因子的影响,例如气候变暖和氮沉降可以通过改变物种栖息地的资源动态、植物土壤反馈以及物种间的相互作用进而影响入侵格局。入侵植物会破坏土著种的群落结构和功能,从而引起生物多样性的降低以及生态系统功能的减弱。有学者研究了温度增加和氮富集对入侵种生长的影响,但是这两者是如何通过影响入侵种与本地种之间的竞
学位
作为反无人机的重要手段之一,侦察无人机被用于侦察特定区域来探测并打击非法无人机。由于侦察无人机通常采用电池供电,并且易受侦察环境和自身物理限制等因素的影响。因此如何为侦察无人机规划出可行高效的侦察航迹成了保障侦察任务完成的关键。本文分别针对多侦察无人机和单侦察无人机场景中的3D侦察航迹规划展开研究,主要的研究内容和创新工作总结如下:1.针对现有多无人机航迹规划方案忽略侦察区域优先级以及缺乏对侦察区
基于第三方机构的集中式版权登记存在效率低下、数据存储不安全等问题。而区块链因其去中心化、数据不可篡改等特点为当前数字版权领域的问题提供了新的解决途径。本文以性能优良且带有身份认证的超级账本(区块链3.0)作为基础平台,研究基于超级账本的数字版权登记技术,主要工作如下:(1)设计基于超级账本的版权登记系统架构。首先,用户通过超级账本的成员服务提供者(Member Service Provider,M
学位
随着移动智能终端日渐普及,以及与之相应的定位技术飞速发展,基于位置的服务已广泛融入到人们日常生活中。这类应用程序通过位置服务来获取用户的位置信息,并提供给第三方来请求相应的服务(如查询天气)。根据研究统计,人们在日常生活中所使用的应用程序,其中与位置信息相关的服务大约有80%。基于位置服务能够极大的方便人们生活和提高生活效率,但随之而来的大量用户位置信息中包含了许多敏感信息,这些敏感信息可能被不法
学位
随着卫星通信的快速发展,卫星终端数量的量级越来越大,终端测试仪的重要性也体现在研发、生产、维护等多个过程中。但是传统的信令模式对于生产型的测试工作效率很低,已经不具备适用性。而非信令综测对于射频一致性的快速测试有着至关重要的作用,目前国内外仪表厂商已经广泛采用该方案,通过去除模拟小区入网的过程,可以大幅提升效率,同时也满足测试指标的需求,是生产型综测仪必不可少的功能。但正因为缺少了信令交互的过程,
学位
低密度奇偶校验(Low Density Parity Check,LDPC)码是最为接近香农极限的纠错码之一,由于其优越的性能,已经成为第五代移动通信中增强型移动宽带(enhanced Mobile Broadband,eMBB)数据信道的编码方案。因此,关于LDPC码的低复杂度编译码、低时延编译码和高吞吐率的研究具有现实意义。本文的研究内容如下:1.针对数据信道下的LDPC码矩阵特性,使用了一种