论文部分内容阅读
随着计算机网络和多媒体技术的发展,越来越多的人开始从互联网下载获取音乐资讯。这种趋势对音乐信息检索提出了更高的要求。现有的网上音乐检索局限于按作曲者、歌唱者、出版公司等基于文字的信息分类浏览。一种基于内容的哼唱检索可以帮助用户通过哼唱旋律的片断,在大规模的音乐数据库中找到想要的乐曲。这种新型的人机接口方式,对于通过电话网、互联网等实现自然便捷的音乐检索有着巨大的现实意义。
基于内容的音乐检索主要涉及音乐旋律特征提取问题、音乐旋律匹配问题以及音乐数据库构造问题等很多方面,这些都是建立一个完整、有效的音乐检索系统的关键。本文在目前已有研究成果的基础上,对基于内容的音乐检索涉及的以上各个方面展开了研究。音乐旋律特征提取包括基频提取和音符切分两部分,基频提取结合谐波和算法与自相关算法基频曲线的差异,消除了哼唱中噪声的影响与半频、倍频提取错误,提高了系统的准确度。音符切分使用能量曲线先粗切分基频曲线再细切分的分层切分方法保证音符切分的正确性。音乐旋律特征本文使用四维矢量来表示,适应了绝对音高匹配与相对音高匹配相结合的旋律匹配算法。最后根据哼唱者可能出现部分哼唱错误的现象,提出了两层动态规划距离度量方法,提高了系统的鲁棒性和准确度。
根据以上的方法,本文构建了一个基于哼唱的音乐检索系统,实验结果也证明了上述方法的有效性。