论文部分内容阅读
随着互联网音乐的爆炸性增长,以及多媒体技术和信号处理技术的快速发展,数字音乐服务已经成为互联网的主流应用之一。基于内容的音乐应用带来了音乐上人机交互方式的巨大变革,用户直接录入音频就可以获得各种音乐服务。音乐识别技术是数字音乐服务的基础技术之一,是连接音乐应用和真实音乐的枢纽。本文重点研究了音乐识别中的音高分析问题,包括音乐旋律提取和多音估计。(1)针对音乐旋律提取问题,本文提出了一个基于谐波峰值与谐波和函数的新算法,用来提取音乐旋律。算法首先通过谐波峰值对候选基频进行选择,然后通过谐波和函数估计出正确的音高。在对比实验中,本文算法在总准确率和抗干扰能力上均优于倒谱算法、泛音显著度算法和时域YIN算法;在速度上,仅次于时域YIN算法。(2)针对多音估计问题,本文对比和评估了两种多音估计方法——迭代法和联合法。评估实验结果表明:联合法在整体性能上要优于迭代法,具有更好的准确率和适应性;音符个数估计错误是多音估计产生错误的一个重要原因,是多音估计算法改进的一个重要突破口。本文提出的音乐旋律提取算法具有准确、快速和稳定的优点,对现有多音估计算法的评估结果提供了算法的改进方向。本文的研究结果有效的解决了音乐识别中的音高分析问题,可进一步使用于各种音乐应用中。