论文部分内容阅读
随着信息和多媒体技术的发展,音乐数字化被广泛的应用于多种媒体,如无线电广播、数字存储、网络等。如此,在大量音乐中高效地检索和管理音乐成为了近些年研究和发展的重点。对于音乐进行有效的分类及归类是一个重要的研究方向,音乐分类的性能优化更是研究的重中之重。 本文提取了一种符合音乐性质的融合特征,提出了一种结合了深度信念网络(DBN)和隐马尔科夫模型(HMM)的分类模型。首先,从音乐信号中提取充分表征音色、节奏和情感的特征向量;然后利用设计的网络模型对特征向量进行训练,将其映射到一个新的特征空间并计算每类音乐的划分概率;最后,对音乐进行测试,将测试音乐划分到对应概率最大的类别中,并计算测试精度。 本文主要工作如下: (1)将梅尔多频系数用于特征提取中,相比于梅尔倒谱系数,该特征更适用于多层网络模型的训练及分类。 (2)将梅尔多频系数和音乐情绪特征相融合,作为分类系统的输入特征向量,以充分表征音乐信息。 (3)将隐马尔科夫模型和深度信念网络相结合,得到了一种新的网络分类模型,具有更高的速度和更高的分类精度。 本文使用GTZAN音乐库中的十大流派音乐进行了分类测试,该算法的分类精度达到了92.4%。与现有的相关算法进行对比的结果表明,其采用的特征向量和分类模型均优于已有算法。