论文部分内容阅读
随着现代科技的发展,音乐信息检索已经发展为一个新兴的研究领域,在国内外都属于比较热门的研究课题。作为音乐信息检索以及其他音频处理的重要辅助手段,音乐自动分类方法的研究在理论上和应用上都具有重要的意义。中国地域辽阔、历史文化积淀厚重,孕育了独特的中国民族音乐,其地方色彩之丰美,世界各国难与相媲美。对中国民乐研究,在探索音乐文化历史形态的变迁和历史音频修复等方面都有着重要意义。本文采用信号处理、机器学习等领域的技术方法,从特征提取、分类器选择、特征选择三个方面对中国民乐分类方法进行了较深入的研究。本文收集并整理642首中国传统民乐,共分古琴、古筝、扬琴、二胡、笛子、琵琶、南音和唢呐8类,建立了中国民乐音乐数据库,同时对音频文件进行10s长度和20s长度切片处理,形成数据集Folk10s和Folk20s。本文的主要实验数据均来源于此。音乐的自动分类一般可以分为特征提取与分类两个阶段。本文首先通过对各类民乐音频特性的深入分析,建立音乐特性与音频数字特征的对应关系,从音调、响度、音色和节奏4个方面挑选出14个具有代表性的数字特征(共70维),作为民族音乐分类的音频特征。然后使用模式识别领域中常见的5中分类器:BP神经网络分类、朴素贝叶斯分类器、K近邻分类算法(KNN)、决策树分类算法和统计支持向量机(SVM)来探索适合于中国民乐的分类方法。实验表明,SVM在处理民乐分类问题上性能优于其它分类器。为了研究支持向量机核函数的选择和各声学特征集及其组合对分类器性能的影响,本文使用支持向量机在民乐数据集上对各特征集的分类性能进行了评估,并验证了径向基核函数(RBF)的有效性。虽然使用支持向量机在民乐分类上取得了不错的效果,但一些无用特征和冗余特征的存在仍然对分类器的性能造成了一定的负面影响。为减少分类器的训练时间,提升分类准确率,发现最能反映民乐特征的特征,我们分别使用了ReliefF、ReliefF-PCA、Relief-CA三种过滤式特征选择算法在FolklOs数据集上进行了特征选择实验,并提出了两种基于混合模型的特征选择算法:启发式向前搜索(HFS)和启发式向后搜索(HBS)。实验结果表明,这两种特征选择算法均表现出优秀的性能。为了探究HFS和HBS方法在多数据集上的性能,本文在另外两个非音乐类数据集:波形噪声数据集和手写字符识别数据集上进行了特征选择实验。结果表明HFS和HBS不论从分类准确率上还是降维方面的表现都优于其它的方法,这进一步验证了它们的有效性和鲁棒性。中国民乐是一种特殊形式的传统音乐,色彩丰美,艺术价值很高。通过基于内容的民乐分类之后,为进一步的民乐检索和相关的分析处理如民乐修复和数字化重制等工作提供了便利。因此,研究基于中国民乐自动分类方法是一项非常重要而有意义的工作。