基于迁移学习的自动音乐生成方法研究

来源 :西华大学 | 被引量 : 0次 | 上传用户:qzzp666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着社会发展以及人们对生活和艺术的追求,音乐创作的需求量大幅增加,其生产、传播和消费途径均发生了较大的变化,这给传统的音乐创作带来了挑战,如何快速创作出一首满足特定需求的音乐,成为了近年来自动音乐生成的研究重点之一。本文以MIDI音乐为基础,设计了一种音乐数据的文本化表示方法,并将大型自然语言生成模型迁移到音乐生成中来,实现音乐的快速生成,最后设计出了一种融合数理统计和乐理知识的音乐评价模型,为生成的音乐提供更为客观的评价方法。本文的主要研究内容包括:(1)研究了一种音乐数据的文本化表示方法。自动音乐生成的首要任务是将音乐数据转换成计算机能够认识和理解的形式。针对MIDI形式表示的音乐进行研究,参考文本表示形式,分别提取音乐的音高、节奏等信息并将其整合到文本中,将音乐表示为一维的文本信号,便于后续处理和迁移文本生成模型到音乐生成中来。(2)研究基于迁移学习的自动音乐生成方法。首先研究了一种基于GPT-2模型的文本音乐旋律生成方法(MT-GPT-2),该方法将大规模的预训练模型GPT-2迁移到音乐生成任务,使用迁移学习的方法,可以生成长时间序列的旋律,简化了音乐生成。其次,结合一些段落文本生成的方式,考虑到音乐音符维度小但音乐长度相对较长的特点,研究了一种基于音乐文本小节化的生成对抗网络自动音乐生成方法(MT-Leak-GAN)。通过采用准确率、损失率和乐理等评价指标评价生成的音乐,将本文研究的模型与其他音乐生成模型进行综合对比,结果表明本文研究的模型更接近于真实音乐。(3)提出了一种更客观的音乐评价方法。为了解决常规的音乐评价方法具有较强主观性的问题,本文设计了一种融合数理统计和乐理知识的音乐评价方法,数理方面采Wilcoxon检验(符号秩检验)、Mann-Whitney U检验和Kruskal-Wallis H检验,检验数据是否来自同一总体,乐理方面通过旋律中音符的变化程度、旋律的波浪形性质和调式的正确性,对所生成的音乐旋律进行客观评价。基于该评价模型对本文研究的MT-GPT-2模型和MT-Leak-GAN模型生成的音乐进行了测试和分析,结果表明了所用方法的有效性和先进性。
其他文献
基频(1064nm)介质高反膜元件广泛应用于高功率激光系统中。存在基底缺陷的薄膜受到强激光辐照时,薄膜内部产生电场增强效应,从而降低薄膜损伤阈值。介质膜基底缺陷是限制薄膜光学元件性能和寿命的重要因素。薄膜材料会吸收环境中的水分子,改变薄膜应力和厚度等物理特性,薄膜元件的储存和工作环境的湿度会严重影响薄膜光学性能。首先本文对薄膜损伤的机理进行了总结分析,讨论了薄膜材料和光强分布对损伤的影响,对激光损
学位
二维材料凭借其优异的光电性能、良好的机械特性,和超高的电子迁移率等特点,在电子学、光电子学等领域受到广泛关注。然而,大多数二维材料受其能带结构与环境稳定性差等影响,限制了其实际应用。因此,开发兼具优异光电性能和环境稳定性的新型二维材料仍然是一个重要的研究课题。二维过渡金属碲化物(ZnTe、CdZnTe)凭借其宽带隙、良好的环境稳定性以及优异的光电性能,在光电子领域展现出巨大的应用潜力。然而,由于本
学位
本文基于单个双原子分子基态的振动光谱、振转光谱以及离解能等微观结构信息,通过量子统计系综理论将单个微观粒子的运动同其宏观气体系统的热力学量联系起来,建立了联系微观性质和宏观实验现象的桥梁,研究了部分双原子分子基态微观结构对其宏观气体热力学性质的影响。工作分为以下三个部分:第一部分描述了基于分子完全振动能级和乘积近似模型获得气体宏观热力学量的理论方法。以NO分子为例,采用变分代数法(Variatio
学位
金属团簇由于其独特的催化性能备受人们的关注。铝团簇作为简单金属团簇的代表已在实验和理论上被广泛的研究,然而,关于铝团簇的部分基态结构仍存争议,其光电子谱和光吸收谱也未得到合理的解释,同时,为了进一步探讨掺杂原子对铝团簇性能的影响,本文将基于密度泛函理论和粒子群优化技术,对Alnu团簇(n=2-17,u=0、+1、-1)和AlnMnu团簇(n=1-16,u=0、+1、-1)的基态结构、电子特性、光谱
学位
2020年以来,新型冠状病毒开始在我国肆虐,当时环境下最有效的处理办法就是血浆疗法,但血浆疗法中输入到患者体内的新鲜血液中含有大量活性淋巴细胞,有可能导致患者出现输血相关性移植物抗宿主病,为了避免这种情况,就需要使用血液辐照仪对血浆内的淋巴细胞进行灭活处理。课题组结合专业领域并根据本次疫情的需求,创新性地提出了一种基于X波段2.5 MeV电子直线加速器的血液辐照仪,相较于比较成熟的S波段直线加速器
学位
在晶体中掺杂一些过渡金属离子(TMs)可以显著地改善材料的物理化学性能,因而掺杂技术被广泛应用于各个领域。如热电材料、超导体材料、半导体材料等,其性能主要是由晶体的局部结构和TMs的电子态决定的。这是因为掺杂的TMs根据Jahn-Teller效应,可以有效地改变其局部结构,从而影响材料的性能。为了清楚其具体机理,人们通常借助电子顺磁共振(EPR)的自旋哈密顿参量(SHPs)进行全面分析。EPR是研
学位
矢量光束是标量光束的拓展;涡旋光束则是一种具有螺旋相位结构且还携带轨道角动量的光束。矢量光束和涡旋光束是现代光学中十分重要的两类光束,被广泛研究并且广泛应用于光学操纵、光学显微、光学存储、量子信息处理等领域。近些年自由空间光通讯快速发展,而大气湍流的存在会带来光强闪烁、相位畸变等一系列的湍流效应,这将导致通信误码率增加,降低系统的信道容量,极大影响通讯效率。研究表明矢量光束和涡旋光束具有较强的抗湍
学位
大规模多输入多输出(MIMO,Multiple Input Multiple Output)系统是第五代(5G,5th Generation)无线通信系统的关键技术之一。在大规模MIMO系统中,下行链路波束成形、用户选择和天线选择等都需要准确的信道状态信息(CSI,Channel State Information)。在时分双工(TDD,Time Division Duplex)模式下,下行链路C
学位
随着深度学习方法在图像去运动模糊领域的不断发展,现有算法的主要思路是通过设计不同的网络模型或者加深网络来提高算法去运动模糊的效果,但是却忽略了图像的实际退化过程,在模型设计时没有考虑噪声的影响,且模型复杂,计算开销大,以致于去运动模糊效果在主客观评价指标上都有待提高。因此,实现更好的去运动模糊效果和简化网络模型是十分重要的。在此背景下,论文主要围绕运动模糊图像的去模糊问题展开研究,工作总结如下:(
学位
心血管疾病和呼吸系统疾病的发病率呈上升趋势,危害着人民健康。心音信号与肺音信号中包含了大量的心血管系统和呼吸系统的病理信息,能有效辅助医护人员进行诊断。听诊是常见的获取心音信号和肺音信号的手段,但采集的往往是心音信号和肺音信号互相混叠和干扰的心肺音信号。针对这一问题,本文进行了以下研究:1)提出了用于实现单通道心肺音信号分离的一种多重约束的非负矩阵分解算法(MCNMF)。本文研究了非负矩阵分解(N
学位