基于改进AlexNet的音乐流派识别研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:baoxiuli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对机器学习模型对音乐流派特征识别能力较弱的问题,提出了一种基于深度卷积神经网络的音乐流派识别(Deep Convolutional Neural Network Music Genre Recognition,DCNN-MGR)模型。该模型首先通过快速傅里叶变换(Fast Fourier Transformation,FFT)提取音频信息,生成可以输入DCNN的频谱并切割生成频谱切片。然后对AlexNet作出了改进:将AlexNet中卷积层的激活函数线性整流(Rectified Linear Unit,Re LU)函数替换为带泄露整流(Leaky Rectified Linear Unit,Leaky Re LU)函数,解决Re LU函数带来的神经元坏死问题,避免Re LU函数自变量进入负区间后神经元不学习的问题;将AlexNet中全连接层的激活函数Re LU函数替换为双曲正切(Hyperbolic Tangent,Tanh)函数,利用Tanh函数零均值化处理的特征,在迭代过程中不断增强网络对音乐特征的提取效果;去掉AlexNet中对音乐特征识别的泛化能力增益较弱的局部响应归一化(Local Response Normalization,LRN)层,使网络更易并行化;将AlexNet第一个卷积层的输出节点减少至64个,第二个卷积层的输出节点减少至192个,第三个全连接层的输出节点减少至10个,通过减少冗余参数来加速收敛网络,减少网络的训练时间;在AlexNet提取特征的全连接层后加入Softplus分类器进行特征分类,提升分类识别效果。其次将生成的频谱切片输入改进的AlexNet进行多批次的训练与验证,提取并学习音乐特征,得到可以有效分辨音乐特征的网络模型。最后使用输出模型进行音乐流派识别测试。实验结果表明,改进的AlexNet在音乐特征识别准确率和网络收敛效果上明显优于AlexNet、VGGNet等其他常用的DCNN,DCNN-MGR模型在音乐流派识别准确率上比支持向量机(Support Vector Machine,SVM)、K-近邻(K-Nearest Neighbor,KNN)等其他机器学习模型提升了4%-20%。该论文有图30幅,表16个,参考文献64篇。
其他文献
政府行政方式的地位作用十分重要.我国原有的政府行政方式基本上是在计划经济体制下形成的,改革开放以来虽已有了较大改变,但用市场经济和WTO的有关规则衡量,仍存有某些不足
背景:甲状腺癌是最常见的内分泌系统恶性肿瘤,其中甲状腺乳头状癌(papillary thyroid carcinoma,PTC)是最常见的分型,其发病率在近几年呈显著增高趋势。虽然PTC预后较好,但仍
电力系统的发展和应用到目前,如同杆多回路架设等现象已经广泛出现。另外,单相、两相用电负荷等因素使得三相不对称状况的日益严重的现象也越来越普遍,还加上各种新型电源的
目的阐述水蛭素不同给药途径及相关剂型的研究进展。方法查阅近年来国内外相关文献,结合水蛭素的药动学/药效学特征、药理作用等方面对水蛭素(包括重组水蛭素)的不同给药途径
在国家安全诸因素中,生态安全是与军事、政治、经济、国土、文化和信息等安全同等重要的一个基本因素,是其它安全的基础或载体。天然林具有人工林不可比拟的生态优势。我国目前
本文从风险评估角度对典型荧光增白剂进行分析,探讨纺织品中荧光增白剂的安全性。
尽管当前外部监管部门对会计师事务所执业质量的监管更加透明化、公开化,不断强化对其执业程序的监督。中注协及相关部门也在根据当前经济环境及具体的业务问题,不断完善对审
1884—1905年,俄国根据东北亚国际局势的变化和俄国人移居远东的情况,对境内朝鲜人实行了不同的政策。科尔弗任阿穆尔沿岸总督辖区总督时,对朝鲜人实行限制政策,将俄朝边境的
<正>在2015年全国监狱工作会议上,中央政法委书记孟建柱提出了监狱教育管理科学化的要求,这是对改造罪犯法定职责的坚守与重视。近年来,浙江监狱坚持教育改造中心地位,坚持教
<正>新型毒品,常被称作"俱乐部药"、"休闲药"、"舞会药"等,相对于鸦片、海洛因这些原植物再加工的半合成传统毒品而言,主要为人工化学合成的毒品,所以又被称作"实验室毒品"、