【摘 要】
:
越来越多的终端设备、会议系统开始搭载传声器阵列,以提高语音前端系统的性能。传声器阵列的一个基本功能是实现说话人的波达方向估计,估计结果可以确定说话人的位置,这常常是语音增强、语音分离等声信号处理算法的重要先验信息。基于声信号处理的常规波达方向估计算法可以在理想的低混响、弱噪声场景中获得准确的估计结果,但是实际声学环境中通常存在较高的混响和较强的噪声干扰,在这种复杂场景中常规算法难以实现鲁棒的估计。
论文部分内容阅读
越来越多的终端设备、会议系统开始搭载传声器阵列,以提高语音前端系统的性能。传声器阵列的一个基本功能是实现说话人的波达方向估计,估计结果可以确定说话人的位置,这常常是语音增强、语音分离等声信号处理算法的重要先验信息。基于声信号处理的常规波达方向估计算法可以在理想的低混响、弱噪声场景中获得准确的估计结果,但是实际声学环境中通常存在较高的混响和较强的噪声干扰,在这种复杂场景中常规算法难以实现鲁棒的估计。本文主要关注在复杂场景下实现目标话者波达方向的鲁棒估计,重点研究如何利用语音直达声信号抽取策略提高波达方向估计算法的性能。在短时傅里叶变换域中筛选由语音直达声信号占主要作用的时频点用于波达方向估计是提高估计准确性的常见思路之一,本文介绍了近年来多种语音直达声时频点抽取策略,通过仿真测试不同算法的性能,讨论并分析不同算法的优点与缺点,验证了合适的语音直达声时频点抽取算法可以提高波达方向估计的准确性这一观点。受“优先效应”的启发,我们分析发现语音信号开始部分的时频点直达声占比较高,包含着较为准确的说话人波达方向信息。由此,本文提出了一种基于语音上升沿特性的直达声时频点抽取算法,结合改进的权重预测误差算法,获取语音直达声信号用于目标话者波达方向估计。使用仿真测试对比了提出的算法与其他直达声时频点抽取算法,验证了所提算法的性能。在复杂场景中,除了高混响通常还有强烈的非平稳干扰噪声。由于常规基于声信号处理的算法难以区分语音信号和噪声信号,在复杂场景通常很难获得准确的说话人波达方向估计结果。神经网络技术可以用于解决常规算法难以处理的问题,在图像和自然语言处理领域获得了巨大的成功。受图像分割领域U-net的启发,本文提出了基于多任务U-net的目标话者波达方向估计算法,通过神经网络抽取由语音直达声信号占主要作用的时频点,结合常规波达方向估计算法,估计目标话者的波达方向,并通过仿真和实验验证了所提出算法的性能。
其他文献
随着信息技术的飞速发展,现代战争的形态与样式发生了翻天覆地的变化,信息化时代的战争已经是体系与体系的对抗。对作战体系中各实体之间复杂关系进行描述是作战建模的关键,也是难点所在。在多任务的作战背景下,如何应对瞬息万变的战场态势及作战的高时效性、高对抗性和非对称性,辅助指挥员进行智能指挥决策,确保作战任务高速、高效的完成,是现代信息科学、系统科学和军事科学交叉的重要研究方向。因此,本文在多任务的作战背
尽管人类社会不断发展,科技不断进步,人们却一直没能摆脱传染病的侵袭。2020年起,新型冠状病毒肺炎(COVID-19)的全球大流行前所未有地影响了人们的工作与生活,严重危害了人民的生命健康,对社会和经济造成了巨大的破坏。为了研究新冠病毒的传播机制与特征、预测疫情发展趋势,本文选取美国的新冠疫情作为研究对象,对其疫情数据进行分析建模。首先,本文深入分析了经典的ARIMA模型、SIR与SEIR动力学模
随着工业水平的不断提升,零件表面三维形貌测量需求的不断提高,对测量系统的高精度、大范围的要求也越来越严苛。本文设计了一种适用于三维轮廓测量的高精度Z轴补偿二维工作台。采用共基面的结构设计,步进电机加丝杠驱动,光栅尺反馈实现XY方向定位。并在工作台上采用了电感位移传感器和光学平晶来实现Z轴补偿。基于此Z轴补偿工作台,采用光谱共焦位移传感器搭建了一套Z轴实时补偿的三维轮廓测量系统,通过stm32实现下
目的研究稀土氧化钕致人支气管上皮细胞(16HBE)炎症反应中circ_0000638的功能,探讨其可能的作用机制。方法不同剂量氧化钕处理16HBE细胞48h后,分别采用ELISA和q RT-PCR法检测IL-8和IL-1β的表达。选用80μg/ml氧化钕浓度处理16HBE细胞48h,微阵列检测其circ RNA表达谱改变并用q RT-PCR实验进行验证。circ_0000638干扰/过表达后,采用
燃气管网仿真对于优化管网结构及管网管理有重要作用,在管网仿真模拟中使用的负荷是否贴合实际对模拟结果有直接影响,由于燃气负荷预测可保证预测负荷与实际负荷间误差在可接受范围内,因此有必要将预测负荷用于管网模拟提高管网预见性运行管理的准确性。基于此本文建立了BP-CSO燃气小时负荷预测模型,在负荷预测模型中分析日期类型、天气状况、气温和时刻与负荷的相关关系,其中天气状况由蒸发量、日照时数、气压、降水量、
目的和意义:观察隔药灸治疗寒凝血瘀型原发性痛经的临床疗效,为临床治疗寒凝血瘀型原发性痛经提供优化治疗方案。研究方法:纳入寒凝血瘀型原发性痛经患者98例,随机分为两组,隔药灸组49例,西药组49例。隔药灸组于月经前3天予以隔药灸治疗,每天1次,西药组于月经疼痛时口服布洛芬缓释胶囊,早晚各1粒。两组均连续治疗3天,1个月经周期为1疗程,两组均治疗3个疗程,以治疗前、治疗第1、2、3疗程及随访时的5个时
我国产学研融合进程与产业发展规律和产业结构有关,传统产业由于科技含量不高,总体上产学研融合程度不深。21世纪以来,新一轮科技革命正在酝酿爆发,与产业变革共同重构全球创新版图,重塑全球经济结构,新科技革命在多个领域同时出现变革,并且各领域相互影响,使得创新呈现了新的业态。新科技酝酿了新的产业变革,仅有科技创新,没有将之商品化、产业化的能力无法助推产业发展和经济增长,这需要先进制造与科技创新深度融合,
金线莲[Anoectochilus roxburghii(Wall.)LindI]是兰科开唇兰属多年生草本植物,可全草药用,有“药王”之称,目前野生资源枯竭,来源主要是人工种植。但在人工种植过程中金线莲生长缓慢,活性成分积累不足,且易感病虫害,导致人工种植效率低。植物根际促生菌(PGPR)因具有促生提质生防的效果,常被开发为微生物肥料,应用于农作物和中药材的绿色种植。本研究从金线莲根际菌群中筛选出
背景心跳骤停(CA)严重威胁着人类生命安全,是目前导致死亡的重要原因之一。尽管CPR技术不断提高与完善,自主循环(ROSC)恢复后仍有CA患者最终死于脑损伤,而长期存活患者中可出现永久性认知功能障碍。因此,在成功CPR后,脑复苏成为主要问题。治疗性低温(TH)是临床治疗中可行的重要脑复苏方法之一。TH(32-34℃)能改善CA后复苏患者的神经功能预后并提高生存率,得到了国际心肺复苏联盟的肯定。然而