【摘 要】
:
长期以来,从噪声环境中提取干净的目标语音是一个被广泛研究的课题。传统的单麦克风语音增强算法往往导致目标语音失真,声音质量得不到保证;而麦克风阵列技术可以实现对目标声源的定位以及定向增强,在保证目标语音不失真的前提下获得明显的干扰噪声抑制效果。基于麦克风阵列的声源定位及语音增强方案不仅可以应用于音视频电话会议以提升音频质量,还可以用在智能语音终端上,作为智能设备的声学前端处理器以获得更清晰的语音指令
论文部分内容阅读
长期以来,从噪声环境中提取干净的目标语音是一个被广泛研究的课题。传统的单麦克风语音增强算法往往导致目标语音失真,声音质量得不到保证;而麦克风阵列技术可以实现对目标声源的定位以及定向增强,在保证目标语音不失真的前提下获得明显的干扰噪声抑制效果。基于麦克风阵列的声源定位及语音增强方案不仅可以应用于音视频电话会议以提升音频质量,还可以用在智能语音终端上,作为智能设备的声学前端处理器以获得更清晰的语音指令,进而提升人机交互效率。近年来,麦克风阵列技术被广泛研究并取得相当大的进步。本文主要研究了基于麦克风阵列的声源定位算法和语音增强算法,提出了适用于嵌入式设备的实时声源定位和语音增强系统方案,并以DSP芯片为核心搭建了基于均匀圆形麦克风阵列的拾音系统硬件设备作为方案落地平台。本文主要工作和创新点如下:(1)研究了麦克风阵列技术的背景以及国内外发展现状,特别是基于麦克风阵列的声源定位及语音增强技术的发展历程。研究了麦克风阵列信号处理基础知识。调研了语音信号的产生方式及其特性;学习并应用了针对语音信号特性进行的预处理手段;研究了麦克风阵列拓扑结构,以及构建麦克风阵列时需要考虑的阵元间距的选择问题。(2)提出了基于改进相关性时延估计的低复杂度声源定位方案。首先研究分析了基于高分辨率谱估计的声源定位算法、基于可控波束响应技术的声源定位算法和基于到达时间差(TDOA)的两步声源定位算法这三种经典的麦克风阵列声源定位技术,并以基于到达时间差的声源定位算法为基础,研究并提出了基于改进相关性时延估计的低复杂度声源定位方案。该声源定位方案主要有三点创新,分别是:在时延估计过程中,对广义互相关函数的加权函数进行低通滤波以保证噪声环境中的时延计算鲁棒性,同时进一步降低算法计算复杂度,更好的保证算法实时性;在利用时延估计结果确定声源方位时,借鉴了基于可控波束形成技术的声源定位算法的全局搜索策略,以最小均方误差为准则确定声源方位;针对声源方位动态变化场景下的动态帧数声源定位平滑策略,动态帧数平滑策略综合保证了定位结果的准确性以及对声源方位变化跟踪的敏捷性。仿真实验证明本文提出的基于改进相关性时延估计的低复杂度声源定位方案性能优于普通基于相位变换广义互相关时延估计定位算法。(3)提出了基于噪声建模和后滤波的麦克风阵列语音增强算法。首先研究了几种典型的多通道语音增强算法,包括固定波束形成、自适应波束形成以及后置滤波算法,具体分析了这些典型算法的实现原理、优缺点和适用场合。以后置滤波算法为基础,提出基于噪声建模和后滤波的麦克风阵列语音增强算法,出于对实时性与鲁棒性的考量,本文提出的语音增强算法采用固定波束形成器与后置滤波器级联的形式。该算法的创新点在于对声场中目标信号、方向性干扰信号以及环境噪声的综合建模分析以获得目标信号分量的最优估计。仿真实验证明本文提出的基于噪声建模和后滤波的麦克风阵列语音增强算法的性能相较于传统延时求和波束形成算法有显著的提升。(4)设计并搭建了麦克风阵列拾音系统,并实验证实了此麦克风阵列拾音系统的优异性能。拾音系统以嵌入式处理器TMS320C6748为核心,搭配TLV320AIC3106低功耗立体声音频编解码器及2559功率放大器;采用4个SPH0642HT5H-1硅麦构建均匀圆形麦克风阵列。基于此拾音系统硬件设备进行实验测试,测试结果表明本文设计的麦克风阵列拾音系统实际性能较优。
其他文献
血小板功能分析是血栓疾病有效预警和精准防治的重要手段,临床诊疗中对仪器快速检验的需求不断增加,推动了新型检验仪器及相关高性能的控制、通信和数据管理软件的研制。本文围绕血小板功能快速检验和实验室数据管理软件实际产品的创新开发,系统研究了多通道快速检验血小板功能分析仪管理软件的设计与实现。论文首先在综述相关技术研究现状和需求的基础上,论述了通过单模块仪器增加控制机单元数量实现多通道并行检验的仪器PL6
铁路交通不仅是人民日常生活中必要出行方式,还是国家经济发展的大动脉。有砟轨道凭借自身经济性与适用性,在客运、货运领域广泛使用。道床是由大量道砟颗粒组成的散粒体系统,在列车荷载作用下道砟颗粒破碎是导致有砟道床整体力学性能下降的重要原因。因此,研究铁路道床道砟颗粒破碎过程有着重大的理论意义和实际工程应用价值。本文基于道砟颗粒真实形状,实现颗粒可破碎模型精细化建模,以数值试验为研究手段,从单颗粒、颗粒系
随着视频等高费流量的应用已经成为当下文件请求的主流,这给传统的无线网络带来了前所未有的压力。由于前传容量和集中式处理单元的限制,传统的云无线接入网(Cloud Radio Access Networks,C-RANs)已经很难在网络的高峰时段满足高质量和高实时性的请求。为了满足日益增长的通信需求,雾无线接入网(Fog Radio Access Networks,F-RANs)在边缘缓存和边缘计算的
为了缓解工业化带来的环境污染问题,大力发展风电成为了一个重要选择。近年来,我国风电装机容量连年递增,目前已经成为我国的第三大主力电源。然而恶劣的气候条件和复杂运行工况导致风电机组故障频发,给风电机组的稳定安全运行带来了巨大挑战,其中传动系统的故障往往需要较长的停机处理,严重影响经济效益,滚动轴承是风电传动系统的重要组成部分,也是主要故障源之一,开展风电机组的滚动轴承运行状态监测及故障诊断研究具有重
生物质能源储量丰富、分布广泛,生物质气化技术是生物质能清洁利用的重要方式。化学链气化技术利用载氧体中的晶格氧替代传统气化过程中所需的分子氧,省去纯氧制备装置的高成本,同时载氧体具有催化气化和焦油重整的作用,能够提高气体收率和合成气品位。生物质成型颗粒能量密度高,运输成本低,且方便储存,是未来生物质能工业化规模应用的趋势。本文以稻壳成型颗粒为燃料,以天然锰铁矿石为载氧体,对稻壳成型颗粒化学链气化特性
近年来,随着互联网技术的高速发展,城市交通,航空航天,自动驾驶等领域也获得了新的发展机遇。尤其是在智能监控领域,如何在海量数据中精准快速的检测到动态目标并正确的跟踪是一个复杂的问题。以LK光流法为代表的动态目标跟踪算法通过跟踪部分特征点构建稀疏光流场,可以在缺少场景信息的情况下准确的识别并检测到目标位置,实时跟踪动态目标。但由于相关处理器性能和软件架构平台的限制,在系统实时性方面很难达到相关要求。
本文围绕被动声纳目标信号的不确定性及其仿真方法开展研究,主要完成了对舰船辐射噪声和海洋信道的不确定性仿真,提出了一种基于GPU并行计算的不确定性仿真系统优化方案,提高了被动声纳目标信号仿真的真实性,提升了不确定性仿真系统的计算效率。从平稳连续谱仿真、线谱仿真和调制谱仿真三个方面开展了舰船辐射噪声不确定性的仿真方法研究。针对宽带连续谱的不确定性,采用了舰船航速和吨位变化条件下基于三参数模型和舰船辐射
目的胰岛移植是治疗糖尿病的一种很有前途的方法,但是该方法存在一定的局限,其中主要有免疫排斥和胰岛移植过程中的胰岛损伤。水凝胶在细胞替代疗法中用来缓解一些长期存在的挑战,如提供免疫隔离,提高细胞活性等。本研究旨在探索胰岛包裹的新方法,特别强调对水凝胶的结构设计,以提供一个合适的细胞外微环境来改善细胞状态,达到免疫隔离,提高移植效果。方法采用同轴静电喷雾法制备核壳结构多孔微胶囊,收集微胶囊对其进行光镜