论文部分内容阅读
大数据时代背景下,越来越多的音乐著作在互联网上呈现出来。然而海量音乐反而使得用户更难找到喜欢的作品,也使冷门的音乐愈发无人问津。因此,需要最大程度地挖掘音乐间的关联,将与用户喜好音乐相似的歌曲反馈给用户。研究音乐相似性及相似音乐检索等问题具有重要的现实意义。本文围绕音乐相似性测度和音乐相似性检索两个方面展开研究,并根据用户对音乐相似性检索的需求,设计了一套相似音乐检索系统,实现了对相似音乐的快速检索。具体的工作和创新如下:1.音乐相似性测度的研究研究了经典音乐相似性测度-G1算法,在其基础上分别从音频特征提取和近邻度计算两个角度对该算法进行了改进。1)针对G1算法音频特征提取单一,对音乐属性刻画不全面的缺点,提出了一种线性结合的多层特征(Multi-Level,ML)的特征提取方法,从物理、感知、语义三个层面刻画音乐的声学特性。2)针对G1算法近邻计算时存在的枢纽度(Hubs)问题,在现有技术基础上提出全局尺度变换(Global Scaling,GS)算法,依照最近邻类对稳定原则对近邻度矩阵做伸缩处理,缓解了Hubs问题的同时提高了近邻计算的准确率。结合前人研究与以上改进,提出了ML-GS音乐相似性测度。2.音乐相似性检索的研究1)研究了音乐相似性检索的代表性算法-G1-FR,围绕关键技术:空间投影和索引结构构建两项技术展开研究并分别予以改进。1)针对近邻度计算的度量性对空间投影质量以及对相似性检索的影响,使用度量的RJSD替代K-L散度计算高斯特征间的距离,显著提高近邻计算的召回率。2)针对FR索引结构索引效率低的缺点,结合E2LSH技术提出了适用于非矢量特征的索引构建方法-基于快速投影的局部敏感哈希(FMLSH),提高了索引结构在检索场景下的性能。2)结合ML-GS音乐相似性测度和FMLSH索引结构,提出了ML-GS-FMLSH音乐相似性检索算法。该算法能够在几乎不降低检索精度的前提下将音乐相似性的计算复杂度降低至与数据库容量无关。基于该算法设计并实现了一套相似音乐检索系统。