基于深度信念网络和隐马尔科夫模型的音乐自动分类算法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:xamalong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息和多媒体技术的发展,音乐数字化被广泛的应用于多种媒体,如无线电广播、数字存储、网络等。如此,在大量音乐中高效地检索和管理音乐成为了近些年研究和发展的重点。对于音乐进行有效的分类及归类是一个重要的研究方向,音乐分类的性能优化更是研究的重中之重。  本文提取了一种符合音乐性质的融合特征,提出了一种结合了深度信念网络(DBN)和隐马尔科夫模型(HMM)的分类模型。首先,从音乐信号中提取充分表征音色、节奏和情感的特征向量;然后利用设计的网络模型对特征向量进行训练,将其映射到一个新的特征空间并计算每类音乐的划分概率;最后,对音乐进行测试,将测试音乐划分到对应概率最大的类别中,并计算测试精度。  本文主要工作如下:  (1)将梅尔多频系数用于特征提取中,相比于梅尔倒谱系数,该特征更适用于多层网络模型的训练及分类。  (2)将梅尔多频系数和音乐情绪特征相融合,作为分类系统的输入特征向量,以充分表征音乐信息。  (3)将隐马尔科夫模型和深度信念网络相结合,得到了一种新的网络分类模型,具有更高的速度和更高的分类精度。  本文使用GTZAN音乐库中的十大流派音乐进行了分类测试,该算法的分类精度达到了92.4%。与现有的相关算法进行对比的结果表明,其采用的特征向量和分类模型均优于已有算法。
其他文献
受限空间是与自由空间相对而言的,受限空间主要包括:室内传播环境、地铁、隧道、地下商场和地下煤矿开采环境等。本文中,主要对煤矿井下巷道这一类受限空间中的电波传播特性进行
WCDMA网络规划是移动通信网建设的核心部分,无论是WCDMA网络建设初期还是网络的扩容时期,细致周密的网络规划对于网络的建设成本与运行质量都具有极为重大的意义。本文结合WC
近年来,随着海洋开发利用和国防需求的日益增加,水下通信网络成了业界研究的热点。数字信号处理模块作为水下通信网的核心部分,在整个网络中起着非常重要的作用。本文深入研
随着计算机与自动控制技术的发展,实时系统广泛地应用于航空、航天、航海等领域。实时调度是实时系统核心问题之一,因而成为现代工业、军事等领域的研究热点。调度算法是实时
超高速飞行器的问世给传统体制的雷达检测带来了新的挑战,目标的超高速运动会对回波信号带来很大影响:一方面,不同重复周期的回波信号包络会出现距离走动现象;另一方面,回波信
随着通信技术的发展,香农公式给出的单链路信道容量,已经远不能满足人们的需求,人们迫切需要新的技术来增大信道容量,提高传输速率。Foschini等人率先将单链路香农公式拓展到
随着穿墙雷达探测技术的不断发展,超宽带雷达因其具备的高距离分辨率、强抗干扰能力以及较高的测距精度等特点,无论是在军事上还是在民用方面都得到了广泛的应用。超宽带穿墙