基于哼唱的音乐检索

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:zzdlily_4000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体的发展,网络音乐也日益增多。现在人们已经不满足于通过歌曲名、歌曲的演唱者等一些文本信息来检索。特别是对于那些种类繁多的音乐数据,人们也许只记得一个调子,也许只记得一个片断,如何快速有效的通过旋律来检索相关音乐就成为一个突出问题。本文对基于哼唱的音乐检索进行了相关的研究和探索。人们在哼唱过程中存在着随意性,而且男生一般比女生的音调要低;不同的哼唱者哼唱的音调是有差异的,同一哼唱者不同的时刻哼唱的音调也是有差异的:对于同一哼唱者也存在变调、跑调、少唱音符和多唱音符的情况。我们通过一系列的实验分析,得出:对于音乐旋律、节奏的把握上,虽然哼唱中存在大量的音调变化,但是对于所哼唱的同一首音乐,音符之间的音高差基本是不变的,音长比的变化也很小。针对上述情况,本文作了如下工作:(1)采用音高差和音长比作为特征向量,避免哼唱中的变调问题。(2)采用基于音高的连续隐马尔可夫模型对乐曲建模,由于该模型输出的可观测序列是连续值,不是有限的几个离散值,从而可以找到产生任意音高差的概率,将跑调问题数字化。(3)在隐马尔可夫模型中引入相应的隐状态表示少唱音符和多唱音符的情况,从而减少检索误差。(4)使用设定动态阈值点的方法提取哼唱音乐信号的平均幅度差函数的谷值点,将计算出的基音周期增加平滑处理,以提高音高、音长的精确度,从而提高后续的匹配概率。(5)使用音长相似度和基于音高差的连续隐马尔克夫模型概率输出相结合的方法进行音乐检索,考虑音乐的节奏信息。
其他文献
增强现实可以将虚拟的物体合并到现实场景中,并能支持用户与其进行交互,它已经成为虚拟现实研究中的一个重要领域。基于摄像头投影仪的互动投影系统是增强现实的一个重要应用
随着互联网的快速发展,它上面聚集了大量的空闲资源,同时计算机技术的发展使得某些应用需要使用大量的资源,人们对计算机资源的需求和互联上大量资源闲置的矛盾越来越突出,在
随着计算机技术、通信技术和微电子技术的进步,IT技术取得了迅猛的发展。计算机控制技术在交通领域的应用越来越广泛。由于计算机网络的普及无线通信技术的发展,促使计算机和通
无线传感器网络集中了微机电技术、感知技术、嵌入式计算技术、分布式信息处理技术和无线通信技术,孕育出一种全新的信息获取和处理模式。布局和覆盖、节点定位、网络通信协
为了提高资源利用率,减少重复内存占用,多租户云平台中引入了各种形式的内存共享机制。在该机制的作用下,不同虚拟机之间内容相同的内存页在物理内存中以同一个COW(Copy-On-W
JavaEE是一种利用Java 2平台来简化企业解决方案的开发、部署和管理相关的复杂问题的体系结构。基于JavaEE的Web项目开发具有开发过程规范化,开发架构模块化、跨平台、易于扩
本文从介绍入侵检测的基本概念入手,分析现有IDS模型与IDS产品中的常用入侵检测方法,发现这些方法均存在不足,使得IDS产品难以满足IDS所需要的实时性、适应性、准确性和自学习能
三维物体识别是计算机视觉重要分支之一。现有的三维物体识别技术主要是一个利用输入的场景图像数据得到场景特征的表达,再和数据库中存储的物体模型表达相匹配的过程,需要解
在互联网快速发展的推动下,人类生活的基本方式已经悄然发生改变。以往的物质交换方式、信息传播方式演变为新时代的“非主流”,互联网取而代之成为社会生活的必需品。新闻是
在无线通信与电子设备领域的新发展,促进了廉价、低耗、功能丰富的传感节点的发展,这样的传感节点体积小,可以在短距离内实现自由通信.这些微小的传感节点由感应、数据处理及通