基于音乐分类的哼唱检索研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:bear_flysky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
哼唱检索是从音乐本质特征出发的一种基于内容的音乐检索方式。用户可以不用记住音乐名、音乐的演唱者、作曲家以及词曲家等一系列繁杂的信息,只需要能够哼唱出某个音乐片段的旋律即可。本文提出了一种新的哼唱检索方法,即基于音乐分类的哼唱检索。该方法的主要思想是:系统预先将音乐库中的音乐分成固定的几类,并对每类音乐集训练和建立其各自的隐马尔可夫模型。接着,在检索时,根据哼唱信号的物理特征,基于已经训练好的HMM,对其进行分类。最后,提取已经分类好的哼唱信号的旋律特征,与其对应类别的音乐特征库中的旋律特征序列进行旋律匹配。将相似度比较高的几个作为结果返回。基于本文提出的音乐分类哼唱检索研究的需要,本文主要做了以下四个工作:1)对哼唱信号的预处理工作进行了研究。确定了要对哼唱信号进行预滤波、采样量化、预加重以及加窗分帧四个工作。2)对音乐信号特征提取与选择进行了研究。研究了音乐的物理特征和感知特征,以及它们的提取方法,以及确定了音乐信号的分类特征和旋律特征。本文将信号的短时平均能量、短时过零率、Mel倒谱系数等物理特征作为分类特征,信号的音高和音值两个感知特征作为旋律特征。3)对基于隐马尔可夫模型的音乐分类进行了研究。使用了隐马尔可夫模型作为音乐分类的模型,对哼唱信号进行了分类。4)对基于隐马尔可夫模型和动态时间规整的旋律匹配算法进行了研究。分析了两种算法的基本原理,确定了系统所使用的旋律匹配算法。为了证明本文提出方法的有效性,主要进行了两个对比实验,其一就是基于HMM的哼唱检索实验与基于音乐分类和HMM的哼唱检索实验的对比;另一个就是基于动态时间规整(DTW)算法的哼唱检索实验与基于音乐分类和DTW的哼唱检索实验的对比。通过对比实验结果的分析,可以得知本文提出的基于音乐分类的哼唱检索方法在一定程度上能缩短了平均检索时间,提高检索速度。
其他文献
学位
“基于P2P的运营支撑系统的研究与设计”是项目课题“IPv6流媒体分发应用系统支撑系统的开发”的一个子课题。随着互联网的飞速发展,信息技术与信息产业日益受到重视。如何保
无线传感器网络集成了传感器、嵌入式计算、网络和无线通信四大技术,是一种全新的信息获取和处理技术,能够协作的实时监测、感知和采集各种环境或监测对象的信息,并对其进行处理
伴随着地图学、计算机科学、地理信息系统和传播学的发展,态势图正逐步从纸质化走向数字化、信息化。其应用范围也在不断扩大,如今态势图已经被广泛的用于灾害防范、资源勘测
无线传感器网络(WirelessSensorNetworks,WSN)能够通过各类传感器协作地实时监测、感知和采集各种环境或监测对象的信息,这些信息通过无线方式被发送,并以自组多跳的网络方式传
随着信息技术的飞速发展,尤其是计算机技术、网络通讯技术、安全技术以及自动化技术的日新月异,为群件系统的发展提供了广阔的空间。随着我国信息化建设进程的加快,无论是政府、
在3G通信时代,无线网络、无线接入、无线局域网一时之间成为网络界的新宠。石油勘探这一传统产业,主要依靠地质理论与技术人员的经验。在石油勘探领域开展无线局域网研究,在中国
随着Web服务技术及语义网技术的发展,网络中存在的Web服务日益增多。如何有效的定位到所需的Web服务将是该领域的研究热点与一大挑战。语义Web服务技术通过为Web服务提供语义
无线Mesh网络(WMN,Wireless Mesh Network,有称无线网状网或无线网格网)这个名词出现的时间并不是太长,大约在20世纪90年代中期以后,而真正引起人们关注只是在近两年。WMN的
在数据库系统中,查询优化器是一个很重要的模块,它决定了一个查询的执行。而选择性估算算法在查询优化器中扮演着非常关键的角色。不正确的选择性估算结果可能导致查询优化器