论文部分内容阅读
音乐流派自动分类是利用信号处理和模式识别等方法对数字音乐样本按照流派风格通过计算机达到类别自动识别的过程,音乐自动检索与流派分类成为了近几年研究的热点。音乐样本时间长且复杂多变,由不同人声、乐器的多路混合信号组成,因此音乐流派分类是一项困难的模式识别问题,同时具有很大的研究和应用价值。本文基于声学特征和音乐特征,对流派分类识别特征及其提取方法进行了研究,具体的研究工作如下:1、研究了音乐节拍的提取方法,提出结合节拍语义特征和MFCC声学特征的音乐流派分类方法。由于音乐节拍的强度、快慢、持续时间等反映了音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,因此利用小波变换对音乐信号进行6层分解提取低频节拍特征;针对节拍特征差异不明显的音乐流派,用描述频域能量包络的MFCC声学特征与节拍特征结合,并基于音乐流派机理分析用8阶MFCC代替常用的12阶MFCC。对8类音乐流派实验仿真结果表明,基于语义特征和声学特征结合的方法,总体分类准确率可达68.4%,同时特征维数增加对分类时间影响很小。2、研究了基于谱图分离的调制谱特征的音乐流派分类方法。通过分析形成音乐节奏的冲击成分和形成韵律的和声成分在音乐信号中的时频特性,发现直接从音乐信号中提取特征会受到这两种成分相互影响。利用节奏与和声在时频平面具有不同规律的特点,对音乐信号的谱图滤波,分离出音乐中的打击成分与和声成分;对打击与和声谱图分别进行小波调制,得到表现音乐节奏和韵律谱规律的调制谱特征,它表达了音乐流派特点的长时中级特征。仿真实验结果表明:分离后的打击与和声成分谱图更清晰地表征了音乐节奏和韵律的特点和规律,对8类音乐流派提取打击与和声调制谱特征,经LDA降维后利用SVM分类,分类准确率达到了73.5%。3、研究了基于多尺度Gabor图像纹理特征的音乐流派分类方法。由于一般音乐流派分类系统多基于声学特征,从多路混合的声音信号中提取声学特征,会因为各音乐元素相互间的影响而降低声学特征的分类性能,同时音乐语义元素在时频谱图上呈现出清晰的视觉纹理信息,谱图纹理的疏密、方向间接反映了音乐节奏、韵律等流派特点;因此从图像处理角度通过提取谱图图像多尺度、多方向的二维Gabor纹理特征来获得音乐信号不同角度的时频特征,对8类音乐流派实验仿真结果表明,基于多尺度Gabor图像纹理特征的分类效果与声学特征相当,总体分类准确率为73.1%,最高可达83.3%。