论文部分内容阅读
随着数字音乐的快速发展,对音乐进行有效的检索是非常必要的。而现有的大多数情况是通过分析梅尔频谱系数等特征(或其它的光谱系数这些低层(low-level features))对音乐进行检索。由于这些特征只与信号特点相关,不能反映音乐的语意内容,因此在很多应用方面,这些低层特征所表现出来的信息量是不够的。相反,一些中层特征(mid-level features)包含了大量的音乐信息,能够表现音乐的属性,对音乐的分析是非常有用的。其中,和弦就是典型的中层特征。与此同时,和弦与音乐潜在情感还有密切的关系。在类型、风格相似的歌曲中可以发现相同的和弦序列,因此利用和弦序列可以将相似的歌曲有效的检索出来。本论文的研究目的是以和弦为单位建立隐马尔可夫模型,进而构建一套完整的和弦识别系统。主要内容包括以下几个方面:1)对音频文件进行特征提取。分析了现有的一些音频文件表达方式,考虑其时效性,确定了采用音高集文件特征(pitch class profile),从而使机器能够更好的识别和表达音频文件。2)研究MIDI文件的内容及格式,以和弦为单位进行标注,和弦的类型主要为大三和弦、小三和弦,减三和弦。分析一个八度内的音高,以每个音高为根音,提取与之对应的大三和弦、小三和弦、减三和弦,对于每一个和弦,分别建立一个隐马尔可夫模型。3)对每一个已经建立好的隐马尔可夫模型进行初始化和训练,构建一个完整的和弦识别体系。最后取一份已经正确标注的MIDI文件,检测系统的性能。本文在对MIDI语料的标注方面取得了较好的效果。对于一段十秒钟左右的MIDI文件,我们可以正确的提取其中的和弦标识。在建立隐马尔可夫模型方面,借鉴隐马尔可夫模型在语音识别中的应用,可以对每一个和弦建立正确的模型。本文的研究方法可以适当的应用于其他音乐领域。对和弦识别的研究可以为音乐检索服务,即在和弦识别率较高的情况下,对音乐的检索就会变的相当的容易,这在一定程度上显示了系统具有良好的延展性。另外,本文采用音高集文件作为音乐文件的特征表示,这种特征提取算法在音乐情感分析领域有着重要的参考价值。