论文部分内容阅读
众所周知,随着网络技术的迅猛发展,网络上多媒体资源已越来越多。在音乐检索方面,单纯的文字输入检索已经不能满足用户的需求,尤其是网络上的音乐多媒体爆炸式增长的情况下。如何从这些海量数据中快速准确地找到自己喜欢的歌曲已经成为一个研究热点。哼唱检索,依靠其哼唱的方便表达性,在该领域成为了主要的研究方向。哼唱检索的主要研究技术有:哼唱输入文件和数据库文件特征序列的提取,音乐特征的表达和旋律匹配方法的研究。目前在国内外,该方向在理论上已经取得了很大进展,并且开发了很多应用系统,但在扩展性,响应速度,精确性上都有待于提高。本文的研究工作以此展开。 在本文中,我们通过对哼唱检索关键技术的研究,采取了三种可以提高查询速度和准确率的方法。 1)在特征提取部分,分析了现有的两种基音周期提取方法ACF和AMDF,在考虑系统的实时性和准确性的基础上,提出了基于ACF和AMDF相结合的基音周期方法。 2)在旋律匹配部分,为了尽可能的提高检索性能,本文采用了层次式的匹配方法并做出分析与改进,首先采用一种运算速度快但检索精度一般的EMD方法作为过滤器从数据库里过滤掉大部分不可能的候选匹配音乐文件,将剩余的小部分文件组成细匹配的候选集;然后采用一种速度相对较慢但精度高的方法CDTW,从候选集里选出匹配度最高的一些音乐文件,并对其进行排序显示。 3)在排序部分,从机器学习的投票策略上受到的启发,在匹配时对每一种过滤器根据一定的相似度计算方法都计算出一个相似度得分,然后对这两个得分加权相加,以此来判定最终文件的排序顺序,这种融合的方法可以保证获得更精确合理的排序顺序。 本文所设计的系统证明了上述改进方法的可行性,在MIREX测试集上获得了较好的准确率和较快的响应时间。