多音音乐音高估计研究

被引量 : 0次 | 上传用户:huang_hh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多音音高估计(基频估计)是音乐信息检索领域非常重要而困难的研究方向之一,其基本任务就是估计多音音乐每一时刻音符的音高(基频)和数目。音符的发音时间、结束时间的估计有时也列入其中。本文从音乐信息检索的大背景出发,介绍了多音音乐音高估计研究的基本任务、研究价值及与其它研究的关系,然后较系统得回顾了一些有代表性的音高估计算法。在此基础上,本文提出了两个新算法。第一个算法是针对单帧信号的基于最大似然频谱建模的多音音高估计算法。与以往对于整个频谱建模的方法不同,该算法把信号的频谱简化为幅度谱的峰值和非峰区域,峰值进一步简化为其频率和幅度。最大似然模型也随之分为峰值似然和非峰区域似然两个部分。在建模峰值似然时,考虑到峰值检测算法的检测错误,我们提出了“真”峰和“假”峰的概念,并分别建模。在建模非峰区域似然时,我们用该区域未检测到由谐频产生的峰的概率作为似然函数。这两部分似然模型关注的焦点不同,互为补充。我们通过单音训练数据学习这些模型的参数,因为在单音数据中,“真”峰和“假”峰可以比较可靠的区分开来。我们还采用了一种加权的贝叶斯信息准则来估计音符个数。最后,该算法在由真实乐器音符合成的随机和弦和音乐和弦上进行测试,取得了不错的结果。第二个算法是针对多帧信号的基于计算听觉场景分析的多音音高估计算法。在该算法中,我们模仿人脑的声音感知规则,对信号频谱的时频成分做聚集。具体来说,我们在信号连续的频谱中定义了谐波事件的概念,每一个谐波事件是一个四元组(频率、幅度、发音时间、结束时间)。对于待处理的音乐,我们提取其所有的谐波事件并组成一个集合,集合中的每个事件都是基频事件的候选。我们设计了一个支持度传递的算法让这些谐波事件互相投票,选出支持度最高的事件作为基频。该算法在由真实乐器音符合成的随机和弦,以及计算机合成的重奏音乐上进行测试,取得了不错的结果。
其他文献
主题网关在国外已发展成为一种网络信息资源组织的重要模式。该文分析介绍了国内外一些著名的主题网关在资源的选择和描述、提供检索和服务以及解决互操作问题等方面所采取的
在分类理论观的基础上,本研究在目标匹配范式下,使用可以表示一定概念的现实物体或场景的图片材料,通过眼动记录法对分类加工过程的分离,考察了40名创造能力不同的中学生分类
以重大自然灾害如2004年"12.24"印度洋海啸、2008年"5.12"汶川特大地震和2010年海地特大地震等为背景,针对灾区处于环境脆弱的丘陵高山、基础设施贫乏的经济欠发达地区的特点
加强城市交通噪声防治工作是当前一项紧迫而艰巨的任务。交通噪声防治主要采取声屏障的方法来降低噪声污染的程度,当前对日益增多声屏障的监控和维护任务日趋艰巨,因此对声屏
目的讨论局麻隆突下通气辅助下气管支架置入术的可行性与安全性。方法 25例恶性气管狭窄的患者在徐州医学院附属医院介入科行局麻隆突下通气辅助下气管支架置入术。治疗过程
本文以上海某电力物资公司物资管理信息系统开发为研究对象,从实际工作出发,在分析企业目前物资管理系统中存在的问题的基础上,结合管理信息系统开发的基本原理和方法,开发了
通过参考大量国内外有关网络医疗卫生信息资源评价的文献,阐述了网络医疗信息资源评价研究的意义,并将网络医疗卫生信息资源评价方法分为定量评价、定性评价、评价性元数据的
<正> 卡若文化遗址的发掘,是近年来我国在西藏高原昌都地区考古上的重要发现,它是澜沧江流域新石器时代文化遗存的主要代表,它的发现使我们对藏族先民当时的原始社会情况和文
与在校大学生相比,离校未就业毕业生组织化程度低、居住分散、流动性强、就业相对困难,更需要借助信息化手段获取就业服务。构建专门针对离校毕业生的公共就业服务信息管理系统