论文部分内容阅读
音乐是一类重要的音频数据,传统的音乐检索都是关键词的检索,在实际应用方面受到限制。随着互联网技术的快速发展和数字化设备的普及,基于内容的音乐检索研究得到了广泛的关注。本文针对基于内容的音乐检索的关键技术展开深入的研究:提出了钢琴单音符识别方法、音乐和弦特征的表示方法和识别算法。本文主要完成了如下工作:(1)在研究了计算机音乐的发展和基本乐理的基础上,定义了音乐特征的分类,将音乐特征分为:基本特征、部分特征和整体特征,为下一步的音乐识别研究打下基础。(2)根据音乐和声学理论结合语音信号的特性,选取MFCC(Mel-Frequency Cepstral Coefficients)作为单音信号的特征,并对特征矢量维数的选择进行了讨论,分别利用RBF神经网络和支持向量机对钢琴88个单音进行识别,实验均取得了100%的识别结果。实验结果表明所选识别网络对识别钢琴单音信号是有效的。(3)论文研究了在西方音乐和弦识别中使用频率较高的音级轮廓(Pitch Class Profile简称PCP)特征及其计算方法,并给出了具体的计算公式。针对PCP特征在低频段信息模糊的缺陷并结合人耳听觉特性,提出了音乐和弦识别的新特征:MPCP(Mel PCP)。论文基于隐马尔可夫模型(Hidden Markov Model HMM)构建了音乐和弦识别系统,定义了36个状态,每个状态代表一类和弦;通过一个12维的多元高斯函数拟合观察向量的概率分布,该模型分别由高斯函数的均值向量和协方差向量来定义。论文借助Chris Harte制作的标签文件训练得到有监督的HMM。识别过程通过Viterbi算法,对输入信号依照极大似然法来寻找最佳路径,即最佳的和弦序列。论文把两种特征均应用于识别系统中并分析了识别的结果。(4)为了保证推导正确性,隐马尔可夫模型在识别中存在严格的独立性假设,限制了观察值之间的相关性。针对上述原因本文提出了基于条件随机场(Conditional Random Fields,CRFs)的音乐和弦识别算法。通过对HMM和CRFs两种模型在音乐识别结果的对比:HMM的数学复杂度和训练时间都低于CRFs,但是整体识别率远远落后于CRFs。(5)研究了文化算法(Cultural Algorithm CA)的框架和原理,针对CRFs训练时间长和参数估计中出现的问题,提出了一种嵌入文化算法的CRFs:CA—CRFs,并将新算法应用在音乐和弦识别中,与以前算法相比,新算法不仅提高了识别率,而且缩短了计算时间。(6)针对文化算法中个体数目在整个进化进程中的作用,提出了基于模糊控制器优化个体的文化算法,并将改进的文化算法应用于CRFs中,建立了基于模糊文化算法的CA-CRFs和弦识别系统。(7)由于模糊规则的不完善和被控过程的非线性,提出利用模糊自适应控制器控制文化算法的接受函数,优化文化算法。最终,建立了基于模糊自适应文化算法的CA-CRFs和弦识别系统,该系统不仅增强了CRFs的记忆性,而且一定程度上提高了和弦识别率。