音乐相似性研究及其在检索系统中的应用

来源 :电子科技大学 | 被引量 : 4次 | 上传用户:xiaosanhuah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代背景下,越来越多的音乐著作在互联网上呈现出来。然而海量音乐反而使得用户更难找到喜欢的作品,也使冷门的音乐愈发无人问津。因此,需要最大程度地挖掘音乐间的关联,将与用户喜好音乐相似的歌曲反馈给用户。研究音乐相似性及相似音乐检索等问题具有重要的现实意义。本文围绕音乐相似性测度和音乐相似性检索两个方面展开研究,并根据用户对音乐相似性检索的需求,设计了一套相似音乐检索系统,实现了对相似音乐的快速检索。具体的工作和创新如下:1.音乐相似性测度的研究研究了经典音乐相似性测度-G1算法,在其基础上分别从音频特征提取和近邻度计算两个角度对该算法进行了改进。1)针对G1算法音频特征提取单一,对音乐属性刻画不全面的缺点,提出了一种线性结合的多层特征(Multi-Level,ML)的特征提取方法,从物理、感知、语义三个层面刻画音乐的声学特性。2)针对G1算法近邻计算时存在的枢纽度(Hubs)问题,在现有技术基础上提出全局尺度变换(Global Scaling,GS)算法,依照最近邻类对稳定原则对近邻度矩阵做伸缩处理,缓解了Hubs问题的同时提高了近邻计算的准确率。结合前人研究与以上改进,提出了ML-GS音乐相似性测度。2.音乐相似性检索的研究1)研究了音乐相似性检索的代表性算法-G1-FR,围绕关键技术:空间投影和索引结构构建两项技术展开研究并分别予以改进。1)针对近邻度计算的度量性对空间投影质量以及对相似性检索的影响,使用度量的RJSD替代K-L散度计算高斯特征间的距离,显著提高近邻计算的召回率。2)针对FR索引结构索引效率低的缺点,结合E2LSH技术提出了适用于非矢量特征的索引构建方法-基于快速投影的局部敏感哈希(FMLSH),提高了索引结构在检索场景下的性能。2)结合ML-GS音乐相似性测度和FMLSH索引结构,提出了ML-GS-FMLSH音乐相似性检索算法。该算法能够在几乎不降低检索精度的前提下将音乐相似性的计算复杂度降低至与数据库容量无关。基于该算法设计并实现了一套相似音乐检索系统。
其他文献
本论文的任务是研制基于TMS320DM643的用于文本、音频、图像、视频的网络传输与加解密的系统,包括硬件平台和软件平台的设计,并在该平台上实现信息采集、DES/RSA加解密以及网
随着数据媒体等新通信业务需求的出现,基于电路交换的PSTN网逐渐暴露出其资源利用效率和可靠性低的缺陷。VoIP技术采用IP网络作为传输载体实现语音通信,同PSTN网相比,提高了电话
随着计算机网络和多媒体技术的飞速发展,大量的图像数据信息通过Internet进行传输,这些信息的安全性逐渐成为人们所关心的问题。由于传统技术无法对图像这样数据量大的信息进
房地产开发项目中,开发成本控制是房地产企业主要的工作之一。房地产的开发成本控制应该在项目各阶段进行全过程成本管理与控制。通过运用科学合理的管理方法和措施,以达到把各
嵌入式系统的存储器空间和寻址能力是有限的,采用计算机汉字字库存储和识别机理必将限制嵌入式系统的工作性能。因此,研究基于嵌入式系统的汉字存储与识别改进技术尤为重要。
本文从房地产多项目开发的必要性着手,对当前的多项目开发模式进行了探讨,同时指出了多项目管理中的问题,探讨了房地产多项目开发的有效模式,目的是为房地产管理工作提供指导和依
近年来随着海洋开发和水下探测需求的日益增加,高分辨率成像声纳的研究越来越受到重视。目前,使用电子电路的传统高分辨率声纳通常具有较大的体积、较高的功耗和较低的图像更
多输入多输出(MIMO)雷达采用多个发射和接收天线,且每个发射天线发射相互正交的信号,其中分置天线MIMO雷达的天线相距较远,保证了各收发通道间的独立性,能在多个不同方向上对
阵列信号处理一直以来都是大家备受关注的问题,已经应用于多个领域之中,而波达方向估计(DOA)是其中比较重要的部分。由于实际环境的复杂性,现实中往往不是一种信号单独存在,
OFDM(正交频分复用)最突出的优点是频谱利用率高、抗多径时延能力强,适合未来高速宽带无线通信的应用。在宽带移动OFDM系统中,不同的子信道经受不同的信道衰落,具有不同的传