基于DPP的音符自动切分研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:huacheng5215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据爆炸增长的大数据时代,如何高效地对海量音乐进行分类、检索和管理已经成为了难题,传统的人工标注的方式已经远远不能满足需要,所以基于内容的音乐要素分析成为研究热点。基于内容的音乐分析是计算机音乐智能处理领域的重要分支,其中音符的分割和识别是关键技术之一。目前,已经有可靠的算法能将每一段短时周期信号转换为音高,但还没有好的算法能将音高序列转换得到的离散的音符序列进行准确切分,自动音符切分识别还是一个技术难题。本文在音符切分相关研究成果的基础上,结合音乐基本理论、模式识别与机器学习技术,提出一种基于行列式点过程(determinant point process,DPP)的音符切分算法。本文从应用背景、基本概念、数学逻辑和几何意义四个方面对行列式点过程进行了全面的剖析,阐述了行列式点过程建模的可行性,为后续的工作提供了理论保障。行列式点过程模型是一种子集选择模型,本文首先对音乐进行分帧,为每一帧建立一个12维的特征向量,并用行列式点过程模型进行建模,根据有监督学习的原理,对模型参数进行训练,最后利用抽样算法选取一个满足DPP分布的子集,从而实现音符的分割。具体工作内容如下:首先,对音乐数据进行预处理,将音乐统一为11025Hz采样率3秒钟的音乐片段,并剔除了连续重复的片段。通过分帧的方式,将连续的音乐信号抽象为离散的点过程,在分析并推导了基于帧的音级轮廓(PCP)特征提取的原理后,为每一帧建立一个12维的PCP特征向量作为该点的差异性向量。其次,为每一个音乐片段手动标注一个音符帧号对应表,并为手动选出一个帧子集用作训练,该子集由每一个音符的一帧组成。再根据极大似然估计(MLE)原理建立目标函数,在阐述了目标函数可近似为凸函数后,将其转换成凸优化问题,利用梯度下降法进行求解。最后,利用DPP抽样算法,为测试数据抽取帧子集,并与音符帧号对照表进行对比,统计错误率。本文通过交叉验证的方式对200段音乐数据进行实验,实验最终的音符切分正确率为67.92%,不同于传统的信号处理方式,为音符切分提供了一种新方法。
其他文献
随着视频处理技术的不断进步,需要处理的数据量越来越大,对数据处理电路的性能、功耗和灵活性要求也越来越高,可重构处理器的并行处理技术成为提高计算效率和降低功耗的良好
近年来随着高校改革的不断深入,传统的高校教育模式和教学方法暴露出许多的问题.当前我国已经全面进入了移动互联网时代,信息技术也得到了快速发展,在人们的生活和学习中已经
光作为一种信息载体,已经广泛服务于人类社会。但是在存储与处理技术方面,利用光的技术却明显地落后。为了能对光信息进行存储与处理,必须先将光信号变为电信号。这不但丢失
以红壤坡地长期定位试验(1998~2011年)为研究对象,研究了自然林、草地、农作、油茶林和湿地松5种土地利用方式对坡地径流量和泥沙流失量影响,以及不同坡地径流量和泥沙流失量变化
长期演进(Long Term Evolution,LTE)项目是3G的演进,也是目前无线通信领域研究比较成熟且应用前景较广的无线接入技术。随着个人通信设备的普及和网络的发展,无线通信系统中
CMOS MEMS是传感器发展的一大趋势,它将MEMS器件和接口电路集成在一块芯片上。利用CMOS标准流程+MEMS后处理工艺制造的微型传感器能够实现低成本、高性能、高度一致性和大规模
自20世纪90年代以来,土地利用/覆被变化(Land Use/Cover Change,LUCC)已成为全球环境变化研究的热点和核心领域,区域土地利用变化的生态环境效应更是国际LUCC研究中的重要内容和
化感作用是影响植物种间关系的重要机制之一,化感物质分离鉴定及其活性研究是化感作用研究的核心问题。本研究以马唐和野燕麦与小麦等构成的杂草-作物系统为对象,采用气质联用
中国板栗(Castanea mollissima)隶属于壳斗科(Fagaceae)栗属(Castanea),是中国栗属特有种,在我国的分布地域十分广泛,跨越温带、暖温带和亚热带,具有重要的经济价值和生态价值。
近年来,随着多媒体技术的发展,先后有多个数字图像编解码标准相继出现。作为目前世界先进音视频压缩编解码标准之一的AVS,由于与其它国际标准如MPEG-2和H.264/AVC相比,计算复