【摘 要】
:
从卡带时代、CD时代、再到数字音乐时代,音乐数量呈现爆发式增长。唯有对海量音乐资源进行分类,建立高效音乐检索系统,才能帮助人们快速地搜索到期望的音乐。传统音乐分类方
论文部分内容阅读
从卡带时代、CD时代、再到数字音乐时代,音乐数量呈现爆发式增长。唯有对海量音乐资源进行分类,建立高效音乐检索系统,才能帮助人们快速地搜索到期望的音乐。传统音乐分类方法比较依赖于人工标注。在大数据时代,通过人工标注来完成音乐分类任务是低效率且不现实的。因此音乐自动分类逐渐成为研究热点,并被广泛使用。音乐自动分类是实现音乐资源快速、有效检索的基础,其拥有巨大潜在应用需求,因此音乐自动分类方法具有重要的研究意义。音乐自动分类方法有两个关键步骤:特征提取和分类方法。本文基于听觉特性对特征提取和分类方法两个关键步骤进行改进,针对音乐分类任务提出基于听觉特性卷积神经网络的音乐分类方法。本文的主要工作和创新点如下:(1)在特征提取中,本文借鉴语音信号处理常用的耳蜗滤波器倒谱系数,将其应用于音乐特征提取中。耳蜗滤波器倒谱系数提取流程模拟了人耳听觉系统感知声音的过程,使提取到的特征更符合人耳听觉特性。由于音乐信号频域跨度相比于语音信号更宽,因此本文在耳蜗滤波器倒谱系数的提取步骤中增加了低频和高频的滤波器,使提取到的音乐特征更全、更详细,直接提高特征提取的质量。(2)在分类方法中,本文借鉴了Lecun等人提出的卷积神经网络和Taigman等人提出的局部卷积思想,结合音乐分类场景提出并实现了基于听觉特性卷积神经网络。传统卷积神经网络卷积核全局共享,对所有频域信息一致处理,忽略了频域信息差异性。基于听觉特性卷积神经网络通过把音乐时频特征根据频率高低划分成不同区域,只在指定区域内共享卷积核,从而使得不同频率区域内的卷积核学习各自频率区域所需特征。(3)本文针对咖啡馆、学习、夜店和运动四个播放场景来进行音乐适用场景分类实验,其中耳蜗滤波器倒谱系数和基于听觉特性卷积神经网络的组合取得83.58%的准确率,优于梅尔频率倒谱系数和传统卷积神经网络的组合。
其他文献
青秆菊又名蜡菊、贝细工,菊科一年生草本植物。原产于澳大利亚,性喜温暖、干燥和日照充足;喜肥沃而排水良好的土壤;畏寒、伯涝、忌荫湿。于花处理后,大的整枝花可用干大的插花,短小
基于各种零部件对非稀土型低成本镁合金的需求,选择低成本Bi添加镁合金作为研究对象,对比研究了纯Mg及其添加6%Bi(质量分数)的Mg-6Bi合金的微观组织与力学性能.结果表明,2种
木聚糖酶(Xylanase)是可以将木聚糖降解为木糖和低聚木糖的一类水解酶。木聚糖酶在食品研发、饲料生产、工业造纸和环境保护等诸多方面都有着十分重要的价值。由于天然存在的木聚糖酶产量不能满足应用需求,越来越多的学者采用分子生物学手段构建木聚糖酶工程菌。但在研究过程中,对于木聚糖酶蛋白的检测,仅仅停留在酶活力的检测水平,缺乏高效且准确的木聚糖酶蛋白定量方法。本研究通过制备木聚糖酶抗体,期望利用该抗体
通过选取宁夏1978—2005年的有关数据,应用计量经济学的分析工具,对经济增长与对外贸易之间的数量关系建立模型,做了相关回归分析.结果表明,对外贸易对宁夏经济的增长有巨大
<正>卵黄囊瘤是一种少见的起源于生殖细胞的生殖细胞瘤,常见于儿童及青少年,多发于卵巢、睾丸及骶尾部,主要沿身体中线分布,发生于其他部位少见,颅内及椎管内者极为罕见。我
提出了一种在带有反转平台的精密离心机上标定陀螺加速度计误差模型二次项系数K 2的D-最优试验方案。应用该D-最优试验方案,通过重复试验,能够在测试点最少的情况下获得高测
将增强现实技术与移动终端PDA相结合,在PDA上实现真实场景与虚拟增强信息的融合。系统采用基于Fourier_Mellin变换的2D图像匹配技术获取用户的视点参数,利用已标定的来自不同
以湖北省为例,结合农产品加工产业集群的特点,将其分成资源驱动型、贸易驱动型和大企业园区型3种类型,并以湖北省为例,采用案例分析方法,对每种类型产业集群内的企业品牌建设途径
本文针对一起CT20型弹簧机构断路器拒分故障案例,结合现场的故障现象和CT20型弹簧机构的结构特点进行分析,查找出本起断路器拒分故障的原因为合闸弹簧储能不足。同时结合本案
用X射线衍射仪分析了Ti64%Cr(摩尔分数)合金在经过不同的热处理后的相结构,使用TEM分析了该合金的亚结构。结果表明:Laves相TiCr2的C14→C15相变速度很慢,室温下得到的是C14和C15混合相结构。C15TiCr2的亚结构由细微的孪晶