基于张量分析的麦克风阵列语音信号降噪方法研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:wlq8201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在手机通话、视频多媒体会议和车载系统等语音通信系统中,由于受到环境中背景噪声的干扰,麦克风接收到的语音信号通常伴随着干扰噪声,影响语音的可懂度与舒适度,亦或影响语音处理系统后续处理性能。传统的单麦克风语音降噪方法如维纳滤波算法因其简单高效并有一定的效果而应用广泛,但是应用类似的单通道算法可能会造成信号失真或者引入所谓的音乐噪声,不能满足目前多媒体技术发展的应用需求。因此人们开始研究与应用麦克风阵列语音降噪技术,麦克风阵列在接收语音信号可以同时获得信号的时空信息,算法上能更加灵活的利用这样的信息提高降噪性能,同时还能形成波束对准目标声音源,追踪说话人的位置,从而应用在更多的场合。另一方面,近年来,随着多路或多维数据的发展,张量分析已经在量子物理、文本挖掘、数据分析和图像处理等诸多领域得到广泛的研究及应用。张量可以看作是一个多维的矩阵,它是向量和矩阵高维扩展。张量分析的发展使得人们考虑把信号建模成张量形式,在高维空间中通过张量工具解决信号处理问题,尤其适合于分析和处理多维阵列信号。本文详细的介绍了张量(Tensor)理论基础、麦克风阵列的拓扑结构通用模型(general signal model of microphone arrays,GSMMA)、时延估计技术(time delay estimation,TDE)以及麦克风阵列语音信号降噪方法等技术。其中的麦克风阵列语音信号降噪方法,首先介绍了目前已有较为成熟的固定波束形成技术、基于GSC理论原型的自适应波束形成方法和阵列子空间语音降噪方法的原理,并进行了仿真和比较分析。然后,基于张量代数分析方法,探索由通道、时间和频率三个维度将麦克风阵列语音信号建模成张量形式,通过Tucker分解和交替最小二乘法(alternating least squares,ALS)等张量分析工具建立多模滤波器,实现通过三种不同的多模滤波方法进行噪声的滤除或抑制,同时介绍以张量预处理与阵列子空间方法结合的方式进一步提高降噪性能,最后进行仿真分析,算法在整体上均取得了较好的语音降噪效果。本文的研究可为将来进一步在高维空间实现更好的语音降噪效果提供有益的参考。
其他文献
在饲养群中发现一例小鼠腹部自发性肿瘤,通过Micro-CT扫描观测肿瘤CT特征并取患病小鼠肿瘤进行病理检查。肿瘤大小为1.7 cm×1.1 cm×0.7 cm,重1.079g。扫描结果显示
通过建立土边坡有限元模型,运用强度折减法,针对砂、粘土两种土质边坡及有无降雨情况,分析植被根系对不同土质边坡稳定性的影响。结果表明:植被根系能有效的提高边坡的安全系
针对笔类产品款型需求量大、改型快、设计效率低等特征,从计算机辅助工业设计的角度出发,结合计算机参数化建模与计算机模块化的组合创新设计理论,实现了笔类产品的组合创新以及
在pH 8~9的水溶液中,葛根素有稳定的荧光,最佳激发波长与发射波长分别为258 nm和471 nm.当葛根素浓度为1.0×10-7~1.0×10-6 mol/L时,其荧光强度与浓度有良好的线性关
如何对来袭鱼雷进行防御成为水面舰艇对潜防御作战的重中之重。根据世界主要海军国家普遍装备的火箭助飞声诱饵的使用原理、基本战技性能,结合"线导+声自导"鱼雷的作战过程,
目的探讨开腹胆囊切除术、腹腔镜胆囊切除术治疗胆结石的临床价值。方法选择2016年2月至2018年11月本院接收的100例胆结石患者,遵从随机数字表法分为参照组与干预组,分别采取
试验选取400羽1日龄肉鸡随机分为2个处理组,每个处理组分两小组:A和B组,A组为健康鸡只组,B组肉鸡人工感染致病性大肠杆菌(1 0~8cfu/mL)。每个小组5个重复,每个重复20羽肉鸡,
聚甲醛是一种综合性能优异的工程塑料,但是聚甲醛自身热稳定性差,与其他助剂相容性差,因此较难改性得到抗静电和导电聚甲醛复合材料。综述了国内外近些年聚甲醛在抗静电与导
<正>12月4日,遭遇"黑天鹅"事件的上市公司獐子岛(002069.SZ),在停牌51天后,市场终于等来监管层的核查结果。市场普遍怀疑的投苗存货造假、大股东占用资金等被质疑问题并未被
期刊
目的探讨中性粒细胞/淋巴细胞比值(neutrophil to lymphocyte ratio,NLR)与寻常性银屑病及银屑病关节炎的关系。方法回顾分析81例寻常性银屑病和17例银屑病关节炎的血常规指