【摘 要】
:
光学乐谱识别主要研究如何将乐谱图像形式到计算机可识别语义符号。其中谱线删除是重要模块之一,谱线删除算法的优劣直接影响光学乐谱识别系统的最终结果。特别是手写乐谱图像,由于手写音符形式复杂多变,同时叠加各种变形和噪声,使谱线识别和删除尤为困难。因此,研究手写乐谱图像中的谱线删除具有重要的理论意义和实用价值。为了提高谱线删除算法的鲁棒性,本文提出一种基于多尺度多方向局部二值模式和XGBoost的手写乐谱
论文部分内容阅读
光学乐谱识别主要研究如何将乐谱图像形式到计算机可识别语义符号。其中谱线删除是重要模块之一,谱线删除算法的优劣直接影响光学乐谱识别系统的最终结果。特别是手写乐谱图像,由于手写音符形式复杂多变,同时叠加各种变形和噪声,使谱线识别和删除尤为困难。因此,研究手写乐谱图像中的谱线删除具有重要的理论意义和实用价值。为了提高谱线删除算法的鲁棒性,本文提出一种基于多尺度多方向局部二值模式和XGBoost的手写乐谱谱线识别和删除方法。首先,根据乐谱图像特点设计改进的局部二值模式算子。其次,对乐谱图像进行多尺度局部二值模式特征提取,组成高维特征向量。最后,利用训练好的XGBoost模型识别谱线位置,进而删除谱线。实验结果表明,在全部测试数据上F-measure为97.19%,说明具有很高的准确率和召回率,在3个不同测试子集上F-measure分别为96.43%、98.36%和96.79%,说明具有很好的鲁棒性。相比已有的轻量谱线删除算法,本文提出的方法在F-measure上有一定的提升。为了直接利用乐谱灰度图像,本文提出一种结合U-net和Res Net的手写乐谱谱线删除算法。首先,构建合适的网络结构,将U-net的桥接改进为Res Net的跳跃连接。然后,将原始的图像数据进行数据增强,得到更多的训练数据。最后,将训练图像进行切割,训练构建好的深度学习网络模型。实验结果表明,在二值乐谱图像上F-measure为98.88%,在灰度乐谱图像上F-measure为99.09%,相比已有的非深度学习方法,本文方法有较大的性能提升,和其它深度学习模型相比,也有更好的删除效果。
其他文献
三维点云孔洞修补技术是一项重要的点云处理技术,由于扫描时仪器、环境等问题引起的点云孔洞会严重影响后续对点云的处理精度,尤其在进行三维重建时,点云中的孔洞往往会造成
随着互联网技术的更新迭代,以图像为代表的多媒体信息的数量开始爆炸式增长。而文字作为一类具有强语义信息的数据,对无人驾驶、机器人导航、场景理解等应用具有指导性帮助。
湿敏传感器在工业生产、农业养殖、医疗器械、环境保护以及人们日常的家用电器中发挥着重要的作用。本论文中使用两步水热法成功在玻璃基底上直接制备了薄膜型Fe2O3-ZnO复合
地方志是在一定时期内全面记录某个地区的社会、政治、自然、经济和文化方面内容的公共文化产品,地方志工作属于政府公共文化服务工作中的一部分,承担存史、资政、教化、育人的功能。我国社会处于经济发展转型新时期,传统的地方志工作模式已无法满足社会对公共文化服务的要求。因此,我们需要对地方志工作如何提供高水平的公共文化服务做进一步的探索和实践,以便更好的服务社会发展。本文从建立公共文化服务平台的角度对地方志工
当前,我们经济社会正发生的巨大的变化,随着发展的不断加快,各类社会矛盾日益凸显。在此背景下,传统的社会治理模式已不能适应当前的新形势、新问题,亟待进行创新。针对这一
气动肌肉关节能模仿动物关节运动特性,具有本质柔顺性,可增强四足机器人环境适应能力,但气动肌肉关节转动范围小,关节力矩难以测量与控制,限制了四足机器人的运动能力。具体
车载自组织网络(Vehicular Ad-hoc Networks,VANETs)作为智能交通系统的重要组成部分,为解决道路通行效率和车辆安全行驶等关键问题提供了灵活且快速的数据传输支持。然而,车
随着时代发展,汽车在我们的生活中越来越普及,随之由汽车导致的交通事故量也迅速增加,而事故发生最主要原因是由驾驶人员的不良习惯与违法操作所导致。其中车辆压线是最为常
视觉检索任务(Visual Grounding,VG)的目的在于通过一句自然语言的查询,去定位一张图像中与该查询语句最相关的物体或区域。通常来说,为了完成这一任务,我们需要一个模型去理