基于深度学习的音乐风格识别与生成技术研究与原型实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:aiyang1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
使用计算机自动生成不同风格的音乐是音乐信息检索和音乐制作中比较重要的热门领域。越来越多的研究者投入到自动化音乐生成领域中,目前音乐自动化生成已经被很多的作曲家运用。由于深度学习和机器学习在最近几年的兴起,以及计算机软硬件性能的高速提升,为自动化生成不同流派的音乐奠定了很好的基础。在此之前,大多数研究者都是使用深度学习网络进行音乐的流派分类识别。现在,更多的研究者开始使用深度学习进行音乐生成,因此研究不同流派的音乐生成很有意义。由于LSTM网络在处理长时间序列问题上有很好的效果,因此本文在已经对LSTM网络有了一定的了解的前提下,运用所掌握的相关深度学习知识,设计并实现了一个能生成多种流派音乐的算法模型。本课题的主要研究内容包含以下几方面:1.音乐数据的预处理,在预处理过程中包含了音轨的分离和运用音轨拼接等技术对音乐特征进行获取,特征包括了音色、音调和响度等。同时还对音乐数据进行了量化处理,输入数据和输出数据格式进行了设计。2.在LSTM网络的基础上,重新设计了音乐流派风格识别和生成网络。在该网络中所有的音乐流派子网都共享了解释层,这样可以大大减少模型参数的学习,提升学习效率。每一个音乐流派子网分析不同流派的音乐,实现了多任务同时处理的作用。3.在对网络的参数选择中,通过实验的方法对比了隐藏层层数和每一层神经元个数对实验结果的影响,最终找到最优的网络参数,同时还介绍了其他参数是如何选择的。4.采用前向传播和反向传播的方法进行网络参数更新,并添加dropout系数对网络进行优化。通过实验,确定最优dropout系数,使用测试数据生成了包含了音乐特征的矩阵,通过编写脚本将音乐矩阵转换成可以播放的音乐。在实验的过程中,使用GANT中的流派数据,对音乐流派风格识别与生成模型进行测试。通过分析生成的音乐序列和原始的音乐序列的频谱图和声谱图,说明了该网络在不同流派音乐生成上有着良好的表现。同时,还对比了使用RBM方法与本文提出的方法生成音乐效果,说明了该方法的优越性。
其他文献
本文选取的案例属于盗骗交织的典型刑事案件,案例中的行为人既实施了盗窃的行为又实施了欺骗的行为,行为的复杂性给这类型的刑事案件定性带来了很大程度的困难。笔者通过对案
本文从制度经济学的角度探析产权和市场的亲合关系下国有企业改革效率.转型时期预示着社会整体性制度变革,但国有企业改革中企业本身制度以及制度环境均没有得到满足.走出转
现阶段,银行的竞争日趋白热化。现代商业银行需要不断丰富营销手段深入挖掘潜在客户,追求更高的经营效益。银行客服中心在这个过程中起到关键性的作用,尤其是其外呼系统,可以
以硅烷偶联剂、相容剂、流动性促进剂等助剂改性硅灰石粉体材料,代替部分昂贵填料应用于运动鞋生产,使用情况良好。
精神型领导关注从精神层面关心员工,与员工共同构建一个组织未来发展的愿景,组织成员可以在追随组织目标和组织愿景的过程中感受生命的意义,最终使组织在残酷的竞争中崭露头
<正>第一部分:开题报告一、选题背景与意义(一)选题背景我国的教育一直是我国重点关注的领域,尤其是在新课程改革的背景下,很多教学科目都开始受到关注,并且有越来越多的教育
会议
<正> 今年2月和4月,为了解西方主要国家电力市场化改革进展情况,以及改革后涉及电力立法和电价机制情况,我们先后去美国、日本、英国、法国、比利时和欧盟总部作了一些调查。
“山重水复疑无路,柳暗花明又一村”,用这两句古诗来形容当下的南安中宇卫浴,可能再合适不过了。$$ 自今年5月以来,围绕中宇卫浴的坏消息可谓一个接一个:先是曝出在德国上市的中
报纸
通过信号源模拟EUT信号小于背景环境、EUT信号等于背景环境、EUT信号大于背景环境及EUT信号与背景环境不同频率时的试验研究虚拟暗室背景滤除模式,进一步得出虚拟暗室背景滤
纸是文化的载体,它生在中国,传播与发展在世界。藏纸是西藏,乃至整个藏族聚居地区所产纸的统称。藏族的造纸历史很悠久。藏纸的造纸原料是就地取材,用一种西藏产的名叫“瑞香狼毒