钢琴自动记谱技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:shadowhigher
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动音乐记谱是指利用计算机技术将一段音乐信号转化为乐谱等符号表达形式的过程,现已在音乐辅助教学、即兴音乐创作等方面广泛应用。由于多音音乐中存在严重的频谱重叠现象,实现其自动记谱目前仍面临巨大挑战。钢琴作为典型的多音乐器,音域宽广且和弦丰富,其自动记谱研究对于多音音乐具有重要意义。本文以音符级别的钢琴自动记谱为研究内容,主要工作及创新点包括:  1.提出了一种基于卷积神经网络(Convolutional Neural Network,CNN)的音符识别方法。目前深度学习技术仅用于帧级别的记谱方法中,但帧级别的记谱结果并不能严格对应音乐中的基本音符事件。本文将深度学习技术推广至音符级别的分步估计方法中,使用两个CNN实现音符的识别。其中,一个CNN用于检测音符的起始点,另一个CNN用于在每一个起始点处估计音符的音高。实验结果表明,CNN相比其他网络结构更适合音符起始点检测和多音高估计任务,且两个CNN的分步使用可以比单一CNN产生更好的记谱性能。  2.提出了一种针对特定钢琴个体的两阶段记谱方法。利用钢琴个体信息更有针对性地对音乐进行分析,是提升记谱性能的有效方法之一。在本文提出的两阶段记谱方法中,第一阶段借助前文提出的音符识别方法实现钢琴个体无关的初步识别,第二阶段利用特定钢琴信息对识别得到的候选音符进行确认。本方法的音符确认阶段借助非负矩阵分解(Non-negative Matrix Factorization,NMF)实现,仅使用候选音高的起始模板在候选起始点处进行分解。相比于传统的NMF,本文提出的音符确认阶段侧重于对音符起始阶段建模,且有效降低了算法的时间复杂度和空间复杂度。实验表明,音符确认阶段的添加使得系统性能进一步提升,尤其是在准确性方面。整体来看,本文提出的方法已达到目前特定钢琴自动记谱最优的性能。  3.提出了基于音符级别音乐模型的钢琴自动记谱方法。不同于现有的帧级别音乐模型仅能在帧与帧结果之间起到平滑作用,本文提出的音符级别音乐模型可以描述音符之间的结构关系。受隐马尔科夫模型思想启发,本文构建了一个集成模型用于整合音乐模型和声学模型(音符识别模块)的输出。针对阈值判断后得到的音符识别结果,本文还提出了一种局部束搜索算法,使用音乐模型和声学模型的输出对空白起始点处的音符进行预测。实验结果表明本文提出的局部束搜索算法可以有效提升音符级别的记谱性能。对比不同音乐模型还可发现,受限玻尔兹曼机和递归结构的结合比单个递归神经网络的性能更优。  4.研究了基于复数CNN的钢琴自动记谱方法。使用复数值对音乐信号进行表征和计算在计算角度、生物学角度和信号处理角度上都具有重要意义。本文使用复数CNN构建音符识别模块分别进行起始点检测和多音高估计,并将其应用于基于音符级别音乐模型的自动记谱系统。与实数CNN相比,复数CNN对应的记谱性能在各个指标上均有提升。
其他文献
该文重点研究了空时二维自适应处理中的降维问题.主要针对各种降维处理算法进行了深入研究,改进并提出了一些算法,将这些算法应用于机载雷达与移动通信的杂波或干扰抑制中.主要
随着全球经济的快速发展,我国商业银行的竞争日趋激励,随之也要求商业银行的金融产品不断通过创新,提升其产品的竞争力.随着商业银行金融产品越来越多样化,如何针对金融产品
该文基于对语音信号本身特性的分析,建立了双带激励模型.在此基础上借鉴MBE低速语音编码算法中频率分带技术和码激励线性预测编码中传输残差信号以提高合成语音鲁棒性的思想,
随着经济时代来临,多元化趋势越发明显,地域之间壁垒越发薄弱,物流传输越发频繁.本文简要介绍物流精益化管理概念,并详细描述配送场所、配送部门、配送流程等烟草企业物流精
种子和果实的发育是植物生殖过程中重要的内容。细胞分裂素的活性和浓度与种子的生长和果实的发育有密切关系,一般来说,细胞分裂素能促进座果、影响种子果实中同化物的积累及胚
VoIP领域存在两大相互独立但功能一样的呼叫信令和控制标准:ITU组织的H.323协议和IETF的SIP协议。他们不能互相兼容,也不能彼此包含,只能互通。由于H.323协议提出较早及其成
近年来,城域网(MAN,Metropolitan Area Network)业务的主体正在发生深刻的变化,业务类型从单纯的时分复用(TDM,Time-division Multiplexing)业务向TDM、数据业务、多媒体业务
随着企业财务管理水平和手段的提升,财务工作已不再局限于本身,财务管理内容的宽度和深度需不断延展,以策略型和价值型财务为方向,以业财融合为目标,以财务派驻制为手段,从而
MPLS以其特有的技术优势逐渐成为继 IP技术以来的下一代骨干网的核心技术,其主要应用MPLS VPN也成为了各大运营商争相发展的新型VPN业务。MPLS VPN可以提供 QoS保证、流量工
TTIB(透明带内导音)技术是一种高效率的频谱技术,它可以抗短波移动电台系统上的多径衰落。与其它的抗干扰技术相比,TTIB能同时抑制叠加在信号上的随机相位和幅度调制,将TTIB