基于听觉场景分析的主旋律提取

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:ivyJZ2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主旋律的定义是音乐中人声的基频曲线,音乐的主旋律提取是众多研究领域,如哼唱搜索和歌曲结构分析等的基础。计算听觉场景分析(CASA)算法的目的是将人声与背景噪声分离,所以在理论上采用CASA来进行主旋律提取是一种可行的方案。但是CASA算法对混合信号的信噪比的要求比较高,目前多运用于人声和普通噪声分离。而音乐信号不满足高信噪比这一特点,并且音乐信号中的伴奏不同于普通噪声,其有明显的谐波结构,在结构上更类似于人声,会对人声的分离产生干扰,如果直接采用CASA算法进行主旋律提取而不加以改进所得到的结果并不理想。本文结合了CASA的发展现状和音乐的特点,研究了一种基于听觉场景分析的主旋律提取算法。主要工作内容如下:(1).研究了两种音乐信号预处理的方法音乐信号中的谐波乐器信号和高次谐波信号会对基于计算听觉场景分析的主旋律提取产生一定的影响。为了解决这些问题,本文使用了两种预处理方法。第一种是运用“谐波乐器/打击乐器信号分离”(HPSS)算法对信号进行预处理。由于纯乐器信号,谐波乐器分量和打击乐器分量在语谱图上具有各向异性,利用HPSS对音乐信号进行预处理,滤除对歌声信号干扰比较大的谐波乐器分量,解决了谐波乐器信号干扰的问题。第二种是根据入声和乐器发声的特点,适当降低音乐信号的高频部分,提升音乐信号中的信噪比,解决了高次谐波影响的问题。实验证明,预处理可以显著提高主基频提取的精度。(2).研究了一种基于计算听觉场景分析的主基频提取算法音乐信号中真实音源数量众多,这对计算听觉场景分析是一大挑战。本文引入了多种方法来解决此问题。首先,对音乐信号进行听觉外围处理,对每一个时频单元的滤波器响应和响应包络提取相关函数和瞬时频率特征,构造6维特征向量。然后,利用提取的特征作为三个多层感知器的输入,对每一个时频单元进行基频判定,找出最有可能的基频值,作为此时频单元的基频估计值,并通过基频估计值确定相应的理想二值掩膜(IBM)。接着,通过初始估计和掩膜在每一帧内最多得到两个基频,根据短时连续性可得到多条基频曲线。本文利用迭代的方法,对基频曲线和IBM进行迭代估计,提高预测的准确度。最后,对于多基频曲线中重合的基频点,本文采用一种基频选择算法,利用了信号的短时连续性,从两个主要基频中选择一个作为主旋律。实验结果表明,本文算法对主基频提取能取得良好的效果。(3).提出了一种基于能量比特征的基频预估计方法人声信号和伴奏信号在高频区域的能量分布不同,人声信号在高频区域存在着明显的衰减,而伴奏信号在高频的衰减比较小。本文通过对每一帧中人声基频范围内可能的基频点分别计算该基频点的低频谐波分量和总谐波分量的能量值,计算低频谐波分量所占能量值的比例,通过能量比排序并根据判定规则滤除伪基频候选点,最终对每一时间帧得到初始基频候选值,将此基频候选值作为主旋律提取算法的基频初始估计并最终得到基频曲线。实验结果表明,与采用听觉特征进行初始预测相比,运用能量特征所得到的主基频的准确率有了很大的提高。
其他文献
新课标强调必须视学生为课堂主体,围绕学生的实际需求、发展需要设计教学模式、组织教学内容.在素质教育背景下,核心素养成了当代教育的主流趋势.为了更好地体现核心素养教育
培养学生动手能力是新课改对所有学科提出的基本要求.人才除了具备思维能力之外,还应该具备必要的实践能力.只有将思维转化为实践才能真正实现创造,因此,作为一名美术教学,培
该文旨在阐述BTC-9402设备网管理系统的设计与实现.该文的第一部分介绍了现代网络管理的基本背景知识,而后着重介绍了简单网络管理协议SNMP,这个协议也即就是BTC-9402网络管
剪纸为我国传统的一项民间艺术,剪纸的制作方法相对简单,同时又有着多种多样的造型,深受中学生的喜爱,他们喜欢剪纸过程中的各种创作乐趣.在高中的美术课堂里加入民间剪纸艺
该文首先简单地介绍了ATM技术和网络管理技术的基本概念,包括网络管理的目标、网络管理的功能、网络管理模型和几种主要的网络管理技术,并给出了ATM网络管理的一般知识.文中
可视电话是多媒体通信的重要应用之一.随着微电子技术的快速发展,DSP功能的增强,采用DSP开发较高质量独立机型的可视电话已成为可能.该文在简要介绍了Philips公司的TM1100多
该文首先概述了W--CDMA移动通信系统、移动信道中多径效应对数字传输的影响以及 常见的几中RAKE接收机,第四章中详细介绍了具有信道参数估计的RAKE接收机的几中信道参数分别
视点合成技术是计算机视觉研究的重点和难点之一.该论文涉及视觉处理系统的一些关键算法的研究与开发,进行了以下三个方面的工作:首先,在研究计算机视觉领域许多先进仿真方法
在数字通信系统中,如何提高信息传输的可靠性与有效性,一直是人们研究的重点。1948年,香农(Claude.E.Shannon)在其论文《通信的数学理论》中,提出在有噪信道中通过纠错编码来
随着小波理论的逐渐发展,它的应用范围也越来越广泛.在信号处理领域,将传统的技术与小波理论相结合成为另一个研究方向,这对于研究人员进行水下信号处理提供了一条新思路.该