乐音信号的多基频估计

被引量 : 0次 | 上传用户:wn208001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乐音信号的多基频估计(Multipe Pitch Estimation, MPE)是音频信息检索(Music Information Retrieval, MIR)领域中的重点和难点。多基频估计的主要任务是估计出精确的基频频率值和个数。本文的研究在一定程度上平衡了计算复杂度低与准确率高之间的矛盾关系。本文的主要研究内容和创新点如下:(1)本文对经典的乐音信号多基频估计算法进行全面总结,并发现迭代谱减算法和联合估计算法性能比较突出。本文还系统地分析了多基频估计中三个关键问题的物理原因和解决方法。三个关键问题包括谐波丢失、谐波重叠以及不谐和性。另外,本文利用两类全面的评价准则来评价算法的性能。(2)本文采用谐波乘积谱来求解乐音信号多基频估计的候选基频集,并针对谐波重叠和八度错误的问题,提出谐波重置算法和八度校正算法。谐波重置算法能够分离多个音符的重叠谐波。八度校正算法能够纠正向量[1/4,1/3,1/2,2,3,4]所对应的次频和倍频错误。结合基频候选、谐波重置和八度校正模块以及预处理和后处理模块,本文提出基于谐波重置和八度校正的单帧信号的多基频估计方法。利用谐波乘积谱求解候选基频集,极大程度地降低计算了复杂度,谐波重置和八度校正显著提高了准确率。从而实现了计算复杂度低和准确率高的平衡。(3)本文提出了利用原位和弦与转位和弦中音符间音程关系的和弦识别器来优化候选基频集。基于和弦识别器和隐马尔可夫模型(Hidden Markov Model, HMM),提出了针对多帧信号的多基频估计方法。针对27.5-4186.0Hz范围内的88个标准音符,对每个音符都建模成两状态的隐马尔可夫模型。虽然引入HMM和维特比算法导致计算复杂度略有提高,但该模型与和弦识别器的配合使用,合理地强调了音符的时间连续性,且该算法的准确率比单帧信号方法有所提高。实验结果表明,本文提出的基于单帧信号的多基频估计方法在音符随机组合及乐曲片段中均以较低复杂度获得较高的准确率。基于多帧信号的多基频估计方法在两类试验材料中也都获得了较高的准确率。使用两类评价准则的测试,表明本文提出的两种多基频估计方法均优于经典的迭代谱减算法和联合估计算法。
其他文献
伴随着城镇化步伐不断加快城市人口也不断怎加,为满足住房需要,高层建筑随之兴起,高层住宅虽然能够满足居民的住房需求,但是还有诸多问题需要解决。其中供水管道噪声问题越来越受
国家干预主义和经济自由主义,曾随着不同时代的经济发展状况而交替演进,对各国经济政策的制定及其绩效产生了重大影响。此次全球经济危机使国家干预主义和经济自由主义的争论
班主任是班级的灵魂性人物,特别是农村小学班主任任务更重、责任更大。本文简单分析了农村小学班级及学生学习现状,提出做好农村小学班主任工作必须热爱和关心学生、宽容学生
<正>新课程实施后,教师大胆改革课堂教学模式,小组合作学习成为普遍采用的一种方式,特别是看了杜郎口中学的课堂教学后,更坚定了我们实施小组合作学习的信心。事实上,小组合
应收账款是企业流动资产的重要组成部分,加强应收账款管理,对于降低企业经营风险具有十分重要的意义。对于中小企业而言,资金是维系企业生命的"血液",加强应收账款的管理是发
随着全球化脚步的加快,国际会议变得越来越频繁,国际会议的重要性也日益凸显,而国际会议中诸如语言、文化、思维等方面的差异以及如何提高国际会议效率等问题成为摆在我们面
班级管理是小学教学管理的一个重要方面,班主任是重要的引导者,在这个过程中其不但需要对学生的学习进行督促,还需要对其进行相应的德育教育,班级管理工作的好坏和学生的成长
在长沙大河西先导区规划实际工作中,充分运用TOD发展模式有关理论,在轨道交通线路和快速公共交通系统的支撑下,建立网络化、区域型城市的空间结构。从沿线用地性质、可供开发
介绍了火工品包装概况,提出了火工品包装的通用技术要求,确定了包装容器的类型和常用的包装方法,提出了火工品防护包装设计中应考虑的因素,探讨和提出了火工品包装件的检验方
城市滨水区不仅能为当地居民提供休闲娱乐的场所,而且具有旅游功能,可以为外地游客留下深刻的印象,美好的回忆。本文以南阳市为例,分析南阳市在城市滨水区开发中存在的问题,