论文部分内容阅读
随着网络技术和多媒体技术的迅速发展,大量的多媒体信息都可以从网上获得。其中,音频作为多媒体中的一种重要媒体,其数据量也在迅速增长。因此,如何方便快捷的找到想要的音乐已经成为了一个突出的问题。而利用旋律哼唱进行检索显然是一种非常理想的方法,在近年来也引起了众多研究者的兴趣。作为基于内容音乐检索的一个分支,基于旋律哼唱的音乐检索是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,在网络音乐共享以及生活娱乐方面都具有非常重要的意义。本文在该领域主要进行了五个方面的工作,其中包括:(1)通过对音乐信号基本理论的研究,提出了利用音高差和音长比表现音乐旋律的方法。与仅利用音高差对旋律特征进行表达的传统方法相比,该方法对旋律的变化特征进行了更好的描述,因此准确性也更高。(2)总结了从MIDI文件中提取音符音高和音长等音乐旋律特征的优点,确定MIDI格式作为数据库音乐的文件存储格式,并实现了在MIDI文件中确定主旋律的算法。(3)提出了在哼唱音乐片段处理过程中,信号预处理、基音提取、特征后处理、音符切分等相关步骤的具体实现方法。同时考虑了人们的哼唱习惯和实际处理中碰到的问题,使得对哼唱音乐的处理更加准确。(4)提出了基于校正距离矩阵的特征匹配算法,计算了哼唱音乐与数据库音乐音高差和音长比的相关度,并将结果排序后返回给用户。(5)分析了实验中对结果产生影响的各种因素,总结了系统的优点和缺点,并在实验环境、检索时间和命中率等方面与其它算法进行了比较。哼唱音乐检索系统的研究具有广泛的理论研究价值和实际应用价值。人们希望计算机能够理解音乐,因此本文的工作是在该领域的一次有益探索。