论文部分内容阅读
使用计算机自动生成不同风格的音乐是音乐信息检索和音乐制作中比较重要的热门领域。越来越多的研究者投入到自动化音乐生成领域中,目前音乐自动化生成已经被很多的作曲家运用。由于深度学习和机器学习在最近几年的兴起,以及计算机软硬件性能的高速提升,为自动化生成不同流派的音乐奠定了很好的基础。在此之前,大多数研究者都是使用深度学习网络进行音乐的流派分类识别。现在,更多的研究者开始使用深度学习进行音乐生成,因此研究不同流派的音乐生成很有意义。由于LSTM网络在处理长时间序列问题上有很好的效果,因此本文在已经对LSTM网络有了一定的了解的前提下,运用所掌握的相关深度学习知识,设计并实现了一个能生成多种流派音乐的算法模型。本课题的主要研究内容包含以下几方面:1.音乐数据的预处理,在预处理过程中包含了音轨的分离和运用音轨拼接等技术对音乐特征进行获取,特征包括了音色、音调和响度等。同时还对音乐数据进行了量化处理,输入数据和输出数据格式进行了设计。2.在LSTM网络的基础上,重新设计了音乐流派风格识别和生成网络。在该网络中所有的音乐流派子网都共享了解释层,这样可以大大减少模型参数的学习,提升学习效率。每一个音乐流派子网分析不同流派的音乐,实现了多任务同时处理的作用。3.在对网络的参数选择中,通过实验的方法对比了隐藏层层数和每一层神经元个数对实验结果的影响,最终找到最优的网络参数,同时还介绍了其他参数是如何选择的。4.采用前向传播和反向传播的方法进行网络参数更新,并添加dropout系数对网络进行优化。通过实验,确定最优dropout系数,使用测试数据生成了包含了音乐特征的矩阵,通过编写脚本将音乐矩阵转换成可以播放的音乐。在实验的过程中,使用GANT中的流派数据,对音乐流派风格识别与生成模型进行测试。通过分析生成的音乐序列和原始的音乐序列的频谱图和声谱图,说明了该网络在不同流派音乐生成上有着良好的表现。同时,还对比了使用RBM方法与本文提出的方法生成音乐效果,说明了该方法的优越性。