基于深度学习的印刷体乐谱识别技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wjw909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光学乐谱识别(Optical Music Recognition,OMR)是实现乐谱图像数字化的重要途径,在计算机音乐、数字音乐图书馆、计算机辅助音乐教学等领域有着广泛的应用前景。音乐符号的识别是光学乐谱识别的重要研究内容。乐谱的结构复杂,音乐符号的尺寸较小,部分符号排列过于密集等特点导致了音乐符号的识别精度不高。随着人工智能技术的飞速发展,深度学习在OMR领域得到了广泛关注并取得了初步成果,为OMR的研究提供了一条新的途径。对此,本文以印刷体乐谱为研究对象,利用深度学习技术,对乐谱音乐符号识别方法进行研究。具体研究内容如下:第一,数据集预处理。由于Deep Scores数据集中的音符缺少时值标签,本文为了直接预测出音符时值,采取了人工标注数据的方式为乐谱中每个音符添加时值,在训练音乐符号检测模型时,可将音符时值作为训练标签;其次在原始乐谱中添加噪声、模糊处理、弹性形变以及色彩变换等数据增强手段,以扩充数据集。第二,基于端到端的音乐符号识别研究。研究了基于Center Net的音乐符号识别模型,该模型直接输入整张乐谱图像,采用多任务学习机制,同时训练音乐符号、音符时值的分类任务和音乐符号坐标的回归任务。为了提升不同尺寸符号的均值精度(AP),在原始模型的基础上融入了多尺度预测技术,即在三个不同尺度的特征图上进行独立的训练与预测,再经非极大值抑制(NMS)算法处理后得到最终预测结果。实验结果表明:常规音乐符号识别精度高,时值准确率可达97%。第三,基于谱线删除的音乐符号识别研究。首先研究了基于语义分割模型UNet的谱线删除模型,该模型采用Inceptionv3中多尺度结构来获取图像丰富的语义信息,并将扩张卷积代替池化层以防止图像细节信息的丢失,之后引入了Dropout层防止过拟合现象,同时也可减少训练时间;在音乐符号识别阶段,将谱线删除后的乐谱作为数据集来训练音乐符号识别模型,并与端到端的方法进行比较。实验结果表明:对于版面复杂的多声部乐谱,删除谱线有利于提升密集符号(和弦)以及小目标符号(休止符)的精度。
其他文献
随着中国经济社会的快速发展,人民生活水平不断提高,群众对美好生活的追求和向往推动着体育健身成为消费热点,健康的生活方式、丰富的休闲娱乐需求成为推动体育产业发展的重要驱动力。体育馆、体育场地是体育产业发展的重要载体,场馆场地和体育产业相互促进。近年来,在一系列的推动体育发展政策的支持下,我国的体育馆数量和规模逐年增加,有一部分场馆已经开始进行商业化运营,并取得了较好的成绩。但场馆商业化过程中存在利用
学位
在全球知识经济快速发展的背景下,文化产业对经济增长与社会发展的影响不断加深。我国“十四五”规划要求健全文化产业体系,提出“文旅融合,乡村振兴”的发展道路。我国乡村经济在国民经济中始终占据着重要地位,乡村文化经过漫长的历史积淀也形成了独特的魅力。因此乡村文化和旅游产业融合发展,以拓展乡村特色产业,转换资源优势为价值优势,实现乡村振兴成为一条可行路径。不同的政治、经济、社会发展情况会孕育出不同的文化,
学位
本文利用旗簇给出了 Schur代数以及Fock空间的一种几何构造,从而自然地实现了Schur代数在Fock空间上的作用,并且证明了在特定条件下可以得到双中心性质,即Howe对偶。之后,通过选取一类特定的旗簇,可以进行Beilinson-Lusztig-MacPherson稳定化,将Schur代数提升成一般线性量子群(或AⅢ/AⅣ型i量子群),从而得到了一般线性量子群(或AⅢ/AⅣ型i量了群)对之间
学位
本文以水彩风景画中生命力的表达为主题,探究生命力在绘画创作中的呈现方式。通过美学、哲学、心理学和艺术实践多种不同的维度,对“生命力”的概念进行解读。从浅层概念上来说,生命力指生命活动和生存发展的能力,从美学角度上来说,生命力是艺术美的源泉。生命力是水彩风景画创作中的重要组成部分,我们借助丰富的绘画语言和多样的表现形式,感悟各种各样的艺术作品。正因为绘画作品中生命力的存在,才能引发审美主体与创作者产
学位
本文从中国女性绘画这一大方向入手,主要研究画面中的身体这一符号。以时间为节点将身体符号的演变划分为新中国成立前、成立后到80年代及80年代至今这三大阶段,采用艺术图像学、艺术风格学的研究方法分析各个时代女性艺术家身体绘画的表现特点。结合社会环境的发展以及女性主义的传播这两大影响因素探究身体符号出现以及风格转变的成因。通过梳理女性绘画中的身体符号审美价值,探究中国女性绘画的成长过程,重新认识了自己绘
学位
近年来,越来越多的画家和学者开始关注到绘画作品中的光对画面的情绪表达的重要作用。那么光是如何诉诸于画面并作用于情感的?什么样的光会激发什么样的情绪?如何通过在画面中呈现不同形态的光来表达作者自身的审美理念和情趣?这些问题的解决对我们绘画创作的实践有着重要的指导意义。画家们通过对光的描绘和演绎不仅能够实现自身情绪的表达,还可以完成对观者情绪的调动和激发,引发个体的共鸣。本文创新点在于通过一系列实验总
学位
自2021年起,房地产行业面临调控政策收紧、货币政策不再宽松、金融监管体系严格、土地价格较高的局面,整体呈现规模增速下降、行业利润缩减、竞争不断加剧的状况,土地红利和金融红利相继终结,“控地产、保产业”的基调将长期持续;再加上新冠肺炎疫情下房地产市场需求总量下滑,房地产企业发展普遍遇到了困难。同时,随着国内外气候变化危机愈演愈烈,国家“碳达峰、碳中和”目标下各类产业的绿色发展政策接踵而至。由于房地
学位
文章探讨的是敦煌色彩元素于风景画创作的实际运用。色彩具有表现客观世界和传达情感的作用,能够使人产生丰富的联想和感性认知,达到心灵和情感的共鸣。敦煌莫高窟壁画是中国艺术的宝贵遗产,其色彩表现具有中国文化的内在含义。古人将宇宙的组成元素同颜色结合,利用视觉元素代表自然物质,于秦汉时期形成以五行学说为基础的“五色观”,敦煌壁画的色彩正以“青、赤、黄、白、黑”五种颜色为主,将五色同佛教艺术融合,兼并东西方
学位
随着我国现代化进程越来越深入,我国发展的重心也逐渐从全面提高GDP转变为兼顾经济发展和生态。这个转变最显著的特点是政府越来越重视生态文明的发展。因此,作为国家社会重要制度的法律在这个时候发挥了特别重要的作用。自党的十八大以来,党中央把生态文明建设提高到了特别重要的高度。随着一系列的改革试点及法律制度的出台,我国生态修复责任法律制度已初见雏形,但仍然存在许多问题。当前我国还未就生态修复责任进行专门立
学位
律师服务收费制度作为律师制度中一个重要的组成部分,历来都是被公众和社会较为关注的热点。律师收费制度设置的是否合理,不仅关系到律师与委托当事人的利益,也涉及到我国律师管理制度的完善和发展。传统的律师收费方式主要有:小时收费、固定收费、协商收费、按标的收费等。风险代理收费在上个世纪九十年代作为“舶来品”被引入我国并成为一种新的收费方式,受到社会各界越来越多的关注。律师风险代理收费作为一种新的收费方式无
学位