论文部分内容阅读
近年来,随着在线音乐库的蓬勃发展,用户希望通过自动索引方式找到他们喜爱的音乐,通过音乐来舒缓现代社会快节奏、高竞争压力下的心境和情绪,已经成为一种时尚。音色识别,是音乐信息检索的主要任务之一。因为同一音乐用不同的乐器来演奏或合奏,会带给听众不同的感觉和效果。人们按照自己的喜好选择不同乐器的音乐旋律,这种需求正在不断的增长。由此,音色识别已成为计算机音乐检索领域中的研究方向之一。许多传统的声学特征提取方法已经成功的应用在独奏乐器的音色识别领域中。令人遗憾的是,这些独奏乐器的音色评估算法显然不能适用于现实音乐环境中的和弦音乐的音色识别。因此,对和弦音乐进行音色识别具有重要的现实意义,但也存在一定的难度,特别是当音色相近的乐器合奏产生谐波互相重叠,区分音色的难度会更大。从音频文件中,识别由多种乐器演奏的声音对音乐检索是非常有效的,对自动索引和浏览音乐数据也是非常有帮助的。这也激励人们在音色分类以及基于内容的音乐信息检索方面进行更多的研究。本文首先介绍了音乐背景知识以及研究的现状与目标,参考了MPEG-7的音色特征值标准,增加了时间属性,提出了新的时域特征值。实验表明,用了新的时域特征值与传统特征值进行比较,在乐器分类的正确分类数和置信度上有一定提高。然后分析了独奏音乐分类算法优缺点,并对和弦音乐音色的多标签分类问题进行了研究,利用了传统的多标签分类法和决策树算法,提出了这两类算法的组合算法,即基于多标签决策树(ML-Decision Tree)的分类算法,实验结果表明,基于多标签决策树(ML-Decision Tree)的分类算法比单标签分类法的识别率有一定提高。又利用了传统的多标签分类法和K最近邻算法,提出了这两类算法的组合算法,即基于多标签K最近邻居算法(ML-KNN)分类算法,实验结果表明,基于多标签K最近邻居算法(ML-KNN)分类算法比基于多标签决策树(ML-Decision Tree)的分类算法的识别率有一定提高。