基于特征增强和数据增强的单声道信源分离算法研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:ding7881
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信源分离是指从混合信号中分离出源信号的技术,其中混合的具体过程是未知的。当混合信号录制于单声道时,由于可用的信道信息十分有限,因此单声道的信源分离更具挑战性。在本文中,我们所讨论的单声道混合信号是由歌声和音乐构成的,称为单声道歌声音乐分离(Monaural Singing Voice Separation,MSVS)。MSVS是目前信号领域的研究热点,并且是伴奏提取、歌词识别、歌手信息识别等实际应用的关键技术。早期提出的浅层分离模型由于对混合信号中的非线性关系的表达能力较弱,因此所获得的分离效果不尽人意。随着深度学习的发展,所提出的深度神经网络能够从混合信号中充分挖掘出其中的空间结构信息,从而推动模型实现更好的分离效果。目前分离模型通常将混合信号的幅度谱作为网络的输入特征,这种高维度且包含一定冗余信息的特征往往会加重网络的训练负担。此外,为了进一步提升对混合信号的表征能力,分离模型通常被设计为多层次、多单元的架构,而匮乏的训练数据往往会导致这种模型的严重过拟合。针对深度神经网络在处理单声道信源分离时所存在的问题,本文从分离模型的输入特征和训练数据扩充两方面展开讨论,主要完成了以下工作:(1)提出了基于特征增强的分离模型。该模型根据MSVS任务的特点和歌声、音乐分布的特殊性,通过卷积滤波器生成低维度、去冗余的特征,并进一步和高分辨率的混合信号幅度谱进行拼接和再处理以生成增强特征。这种增强特征保留了幅度谱的关键部分以降低模型的计算负荷,并通过拼接高分辨率的幅度谱来实现对分布较为稀疏的歌声部分进行补充。实验表明,相比直接使用幅度谱特征,基于特征增强的分离网络可以进一步改善分离效果,并有效缩短训练时间。(2)提出了基于生成式对抗网络和变分自编码器的数据增强模型。传统的手动数据增强方法基于混合信号中源独立的假设,然而源之间的相关性正是信源分离困难的主要原因。本文所提出的数据增强网络通过使用变分自编码器来对歌声和音乐的训练集分别进行建模以反转数据的生成过程,并且在变分编码器生成的潜在空间中加入了对抗性训练,使生成式对抗网络中的鉴别器对原始混合信号和生成的混合信号进行分辨训练。实验表明,所提出的数据增强网络可以生成高质量的混合信号样本,并进一步改善复杂分离网络的分离效果。
其他文献
本文结合NSEFC Book 1A Unit 4 Grammar部分的教学案例,通过观察同行的授课过程,并采用行动研究的模式对NSEFC教材教学目标的定位进行了分析和研究。 In this paper, NSEFC
针对航空发动机在研制中对首件鉴定的要求,介绍了首件鉴定定义、鉴定内容,论述了首件鉴定与航空发动机研制产品的关系,并以盘类零件为例说明实施首件鉴定在航空发动机研制中
本文系统归纳和整理了中商文化时期青铜容器的发现和研究情况,重点对其进行了类型学方面的分析。通过型式划分的结果,并结合其他如层位关系、共存陶器等因素,将中商文化时期
阅读能净化人的心灵,陶冶人的情操,阅读是一种丰富的安静,除了获取丰富的知识外,最重要的是让心灵和思想得到成长。教育的根本首先应该着眼于人,只有明确这一点,才能从本质上
作为渠道与压力引水管之间的核心建筑物,压力前池发挥出重要的连接作用,它具有调节以及平稳水头等多项功能。文章以张掖市龙渠三级水电站为例,对压力前池的平面布置、容积、
本文描述了监测压水堆核电站-回路水泄漏率的^13N监测系统的工作原理,系统组成及工作性能。该系统具有探测灵敏度高、可靠性高及响应速度快等优点。
随着经济社会以及科学技术的不断发展,基层水利工程项目的管理要想取得进步,必须要建立健全完善的管理体制.以下介绍了基层水利工程管理的重要性,分析了管理体制的现状,并且
目的探讨颅脑外伤临床CT表现与预后的关系。方法收集颅脑外伤患者72例,进行格拉斯哥昏迷评分(GCS)和CT扫描,详细分析其CT表现与GCS和预后之间的关系。结果本研究72例患者入院时
与孩子交往,往往是“亲其师信其道”,老师要俘获孩子的心,需要有爱心,有亲和力。但与家长打交道,想赢得家长的理解、尊重、支持、配合、信服,光有亲和力是远远不够的,您知道还需要什
文章以一节英语语法课为例,阐述了高中英语情景创设的方法。
期刊