论文部分内容阅读
随着数字音乐的快速发展,基于关键词的传统音频检索方式在实际应用中受到越来越多的限制。基于内容的音乐检索不受关键词的限制,而是根据音乐的固有属性对音频进行检索,因而被越来越多的研究人员所关注。和弦作为一种典型的中层特征,包含了大量能够表现音乐属性的信息,在分析音乐结构和旋律方面具有非常重要的作用。因此,本文针对基于内容的音乐检索技术进行了深入的研究,提出了一种音乐和弦特征的表示方法以及识别算法。本文综合应用基本乐理、信号处理、模式识别的相关知识,提出了一种基于稀疏表示分类器的和弦识别方法,其主要研究内容是以和弦为基本单位建立稀疏表示模型,进而构建一套完整的和弦识别系统。主要完成的工作包括以下几个方面:首先,由乐理知识可知和弦往往在节拍处发生改变,因此本文提出了一种基于节拍检测的特征提取方法。该方法根据Daniel Ellis提出的节拍检测方法,将输入的整个音频文件划分为不同的节拍(音频片段),以节拍作为和弦变化的最小时间间隔。其次,论文研究了和弦识别领域中通常使用的音级轮廓特征(pitch classprofile),并介绍了具体的算法。结合最新的理论,本文确定采用识别效果更好的QPCP作为和弦的特征,从而使机器能够更好的表达和识别音频文件。第三,本文建立了基于稀疏表示分类器的音乐和弦识别系统。该系统将和弦的类型分为大三和弦和小三和弦等共24种,对于每一种和弦,分别建立一个数据库,并提取特征平均值。最后将输入的音频文件作为测试样本进行识别。最后,本论文借助Chris Harte制作的标签文件训练得到有监督的稀疏表示分类模型,并与经典的基于模板匹配的和弦识别方法进行对比。识别结果表明,本文提出的基于稀疏表示分类器的和弦识别方法的平均识别率达到78.6%,比模板匹配的方法高2.7%。