计算机实时伴奏系统

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:jiusea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机实时伴奏系统是让计算机为人的现场音乐表演(独奏或独唱)进行实时伴奏,它包括三个模块:乐音检测,乐谱跟踪和实时伴奏。首先,乐音检测模块通过实时乐音识别获取表演的乐音信息;然后,乐谱跟踪模块将所获取的乐音信息实时定位于曲目的乐谱中,并对定位结果进行动态跟踪;在此基础上,实时伴奏模块根据定位结果,控制计算机实时合成伴奏音。 本文以构建实时伴奏系统为目标,在对相关的乐音检测,乐谱跟踪和实时伴奏等问题进行深入研究的基础上,构建了一个能够在限定曲目的条件下为人的演唱进行实时伴奏的系统。 该系统用麦克风拾取人的演唱信号。由于伴奏音和歌声基本上是同步的,因此麦克风实际接收到的是歌声和伴奏音混叠以后的信号。这给如何从麦克风拾取的信号中提取出歌声中所含的乐音信息造成了很大困难。通常,采用谐波成分分析的方法解决这个问题。该方法对输入信号的短时傅里叶频谱进行峰检测,将找出的各谐波峰频率的最大公约数作为信号的基频估计。该方法有较大的局限性,一般只适用于频谱构成相对单一的乐音信号的识别。而且,由于短时傅里叶变换得到的频谱的频率分辨率在整个频段是一样的,导致该方法对低频谱峰的检测能力降低,可能出现漏检现象。结果,导致该方法所给出的基频估计经常发生错误。为此,我们提出了一种新的谐波成分分析算法。首先利用伴奏音的先验知识将伴奏音的倍频成分从频谱图上滤除,再对剩余的峰进行人声基频的检测。与传统方法不同,该算法不是简单地将找出的各谐波峰频率的最大公约数作为信号的基频估计,而是采用假设检验的方法来确定基频估值。首先将各显著频谱峰频率的分数值作为可能的基频的候补;然后,根据候选基频应该具备相对丰富的倍频成分的知识,检查所得到的频谱中是否存在这样的倍频成分;最后,根据实际频谱在候选基频各倍频处的分布情况进行综合判断。该算法能够在混叠有伴奏音的情况下实现对歌声的识别和在线分割。为了满足系统的实时性要求,在低时延的约束下实现对歌声的在线分割,即在一个新音的起音阶段就对其进行通报。 乐谱跟踪是实现实时伴奏的重要步骤。一个好的乐谱跟踪算法应该具有较强的容错能力。现有的算法存在较大的缺陷,有的采用很窄的滑动窗口导致定位视野过窄,容错能力差;有的则设定最大的固定窗将定位视野扩大到全局范围,这样做虽然为实现正确的匹配提供了可能,但过大窗口范围的设置不仅增加了计算量,也为误匹配埋下了祸根(有些定位结果虽然从匹配的角度看是最佳的,但实际中并不会发生),反而会影响定位的效果。为此,我们提出了一种基于扩充窗和重构匹配检测器的动态规划算法。该算法,一方面将定位视野限定在合理的范围内,采取窗口起点固定,在适当的时候进行窗长的扩充。之所以选择扩充窗而不是滑动窗,是为了避免因实际演奏片段和乐谱片段误匹配而导致的窗口的强制滑动这种不明智的举动。另一方面,我们希望对扩充窗的最大宽度进行控制以将计算代价限制在许可的范围之内。做法是以扩充窗的最大许可宽度为约束在适当时机重新构造匹配检测器。这里,新匹配检测器的窗口起点设定为当前演奏音符能够准确定位的乐谱音符的位置。这样,对整个乐谱的跟踪由若干个“子匹配检测器”来实现,相对于全局寻优而言计算量大为减少。在实时伴奏模块,针对乐谱跟踪模块得到的定位结果可能不唯一的情况,首先对定位结果进行可靠性分析,然后依据可靠性高的定位结果加入伴奏音。伴奏音的组织也不同于传统的以单个音符为单位的做法,而是采取按小节为单位的方案来组织伴奏音。对伴奏音播放的调整,只对每一个伴奏音小节的整体起效,即在不改变小节内部各个伴奏音之间相对关系的前提下从整体上改变小节的持续时间。实验结果表明,我们的做法能有效地提高伴奏音的质量。 实验表明,本文所构建的计算机实时伴奏系统能够为人的演唱配上效果良好的实时伴奏。其中,对歌声的识别算法具有很好的识别效果,能够保证在低时延的条件下实现对歌声中新音的通报。当对歌声的识别结果偏离乐谱时,仍然能够进行有效和准确的定位,使得伴奏效果保持良好。另外,系统对环境噪声也具备很好的鲁棒性。
其他文献
随着数字摄录设备的发展和影像技术的进步,在越来越多的场合下,人们开始使用视频摄像设备来记录相关的经历和场景,如家用视频、影视媒体、视频监控等,因此各种类型的视频数据量呈
过程控制是自动化专业的一个重要专业方向,实践性很强,针对工业过程控制中多变量耦合系统,开发过程控制系统实验装置是提高过程控制实验教学水平,培养学生工程实践能力的迫切需要
基于性能势理论,对离散事件动态系统进行性能分析和性能优化时,需要计算实现因子和性能势.在这篇文章中,以遍历Markov链为模型,针对现有计算方法的不足,提出了计算实现因子和性能势
数据网格具有分布式存储和处理的能力,能够包容各种异构多样化的数据。它的出现为解决海量多样化的数据处理问题提供了良好的解决方案。副本技术是数据网格中的关键技术。它
在许多模式识别和机器学习应用中,降维是一个基本的问题。近年来,为了解决类的分离问题,出现了应用最大最小思想降维的方法。这些方法特别强调类间的分离,但仅仅只明确考虑了类内
目前,随着机器人技术的不断进步,机器人学科越来越具有强大的生命力,它在某种程度上已经代表当今信息技术、自动化技术、系统集成等技术的最新发展。从移动机器人的历史和现