复杂背景下的声源定位和识别

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:xiaohuzhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能音箱,语音助手,智能办公,机器人等新技术的发展。智能化信号处理,特别是声音信号处理的需求越来越大。人工智能在信号处理领域的应用也越来越广泛。机器听觉和机器视觉一样,在未来将成为智能感知领域的重要应用。因此,在复杂环境,特别是存在环境噪音和室内混响的声学环境下,声源的定位和识别对于智能语音处理来说有重要的意义。麦克风阵列通过多个方向的接收声音信号,对于声源的到达方向(DOA)估计以及重叠声音的识别和分类起到了关键作用。利用麦克风阵列,本文对复杂声学环境下多个声源的定位和识别进行了研究和探索,主要的工作和创新如下:第一,构建了麦克风阵列的传播和接收信号数学模型,分析了基于到达时间差的GCC-PHAT和SRP-PHAT算法,基于谱估计的MUSIC算法和ISSM算法。以及LCMV自适应波束形成算法,并仿真验证了各类算法的性能。第二,进行了真实室内环境中窄带和宽带信号麦克风阵列定位实验,使用MUSIC算法和ISSM算法实现了实验数据的DOA估计,使用LCMV波束形成实现了实验信号的空域滤波。有效过滤干扰信号,保留需要的方向信号。对得到的信号进行降噪和增强处理,可以实现原始信号的恢复。第三,针对传统DOA算法无法实现声音信号分类的缺陷,本文了利用CNN+LSTM网络的方法,以信号频谱和GCC-PHAT谱作为输入特征,训练网络。实现了复杂环境下,同时存在的多个静止声源的识别和定位。并利用已知DOA信息实现了重叠信号的定向分离。测试表明该网络性能明显优于单独的CNN网络和只使用频谱作为输入特征的CRNN网络。第四,针对运动声源的识别和定位问题,提出了对参考的真实DOA方向轨迹进行下采样处理,解决了网络池化后的输出DOA数据与参考轨迹不匹配的问题。引入了Ambisonic空间音频格式的方向声音强度矢量作为输入特征,减少了DOA误差,实现了单个和两个运动声源的定位和识别。上述理论和方法已通过了仿真和实验数据测试验证。结果表明,本文提出的复杂环境下声源定位识别方法可以实现多重声源的分类和DOA轨迹跟踪,并具有一定的抗混响和噪声能力。
其他文献
通过在竖向排水井底面以下土层中设置虚拟砂井,得到了双面排水条件下考虑土层三维渗流从而更符合实际情况的解析解.根据所得解编制了计算程序,分析了在双面排水情况下未打穿竖向
对液态金属钠在环形通道内的单相流动换热特性进行了实验研究。结合实验数据,将液态金属钠单相流动分为层流区(Re≤2 000)、过渡区(2 0004 000),分别拟合得到不同流态下摩擦系数
针对前苏联TOPAZ-Ⅱ反应堆系统所采用回路式辐射器存在单点失效的问题,采用热管式辐射器对其进行改进以提高系统安全性。根据系统废热排出的要求及冷却剂工作温度,选取高温钾
<正> 1 成果内容简介 300kW大型风力机叶片是目前国内研制和运行成功的最大的水平轴定桨矩风力机叶片。 在“八五”期间成功地试制出水平轴定桨矩200kW风力机叶片后,1996年完
选择教学案例是进行案例教学的前提和基础,是案例教学准备的一项重要工作。训练案例选择是否恰当,直接关系到能否达成案例教学的目的。因此,教师要根据确定的案例教学目标,科学
为了评估航天器发射事故中钚-238放射性气溶胶的影响,本文运用高斯弥散模型,计算了事故释放点周围人员受照的有效剂量、可吸入气溶胶的浓度和地面沉积浓度。计算结果表明,不
为进一步深入细致的了解阜蒙县花生病害的发生情况,用几种新药作处理,筛选出适宜的药剂,为做好阜蒙县花生病虫害预测预报工作提供科学依据,2015年阜蒙县植保站在阜新镇桃李村
我们有很多教师在专业发展的道路上,总埋怨没有好的"共同体",也没人"逼",这两条道固然重要,但在专业成长中更重要的是个人的内驱力。我们要强调对自我专业成长的反省认知,提高自
我国是较早进入老龄化进程的国家之一,在此背景下,社会积极采取相应措施维护老年人的合法权益不受侵害,从而保障养老的需求得以实现,而当前某些不法分子抓住老龄化的时代趋势
数学学科对于培养学生逻辑思维能力、提升学生智力水平、提高学生学业成就有积极作用。数学审题能力的培养与数学思维能力的发展密切相关,要求学生具备多方面综合素养,诸如学生对题目信息的提取、分析与处理的能力,以及长期学习、反思与积累的能力。从国内的教学现状来看,审题能力的培养并未引起师生应有的重视,这与新课改的理念背道而驰。研究以此为契机,在梳理相关文献的基础上,以天津市X中学的高二学生为研究对象,确定研