基于旋律的音乐哼唱检索系统的设计与实现

被引量 : 0次 | 上传用户:highbird51426
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音乐作为人们生活中必不可少的一部分,音乐搜索具有广大的用户群体,也蕴含着巨大的商机。传统的音乐搜索是根据用户输入的关键词进行搜索,关键词可以是歌曲的名称,歌手名,歌词等,这种方式被称为基于文本的检索。对于这种方式的检索,如果用户不能准确地记住歌曲的相关信息(歌曲名称,歌词等),就不能准确的检索歌曲。同时,采用这种检索方式需要手动去维护一个音乐数据库,对每首歌曲的基本信息进行标注,增加了管理者的工作量,因此需要找到一种更简单,更快捷的检索方式。哼唱检索便是一种新型的检索方式,它充分利用歌曲自身的特征,如音高,音长等特征,为用户提供一种更简单更自然的检索方式。这种新型的检索方式可以广泛地应用在移动互联网,卡拉OK中,也可以应用于音乐教育等方面。哼唱检索最核心的两部分是音乐旋律特征提取和匹配。如何准确的提取歌曲的特征信息,利用特征信息描述歌曲轮廓;采用哪种匹配算法又快又准确的检索出我们所需要的歌曲是本文的研究重点。围绕这两个问题,本文做了如下相关研究和探索。(1)综合分析了音乐的各种特征,介绍了常见的几种基音提取的算法。包括自相关函数法,平均幅度差函数法等。同时为了使基音的提取更加准确,本文介绍了常用的预处理操作和后期处理操作。总结了当前音乐旋律特征的表示方式,最后确定了本文中采用绝对音高序列来描述音乐特征。(2)介绍了常用的几种旋律匹配算法,包括欧氏距离,编辑距离,DTW算法等。确定了本文中采用LS算法和DTW算法来进行旋律的匹配操作。首先采用LS算法粗略过滤掉一部分差异比较大的候选项,然后利用DTW算法进行二级过滤,完成精确匹配。充分发挥LS算法在时间上的优势和DTW算法在效率上的优势。(3)本文中采用台湾清华大学资讯工程系张智星老师提供的48首MIDI音乐,采用midtoolbox工具提取MIDI音乐的音乐特征,搭建了一个小型的哼唱检索音乐数据库。并在此基础上开发一个哼唱检索系统。本文研究成果的特色之处在于:(1)设计了基于能量的过滤和平滑处理两种后期处理方式,使提取到的基频更加准确。(2)开发了一个批量提取MIDI音乐音高特征的工具,采用此工具可以很方便的提取MIDI音乐文件中的音乐信息,构建一个音乐特征数据库。(3)综合采用LS算法和DTW算法进行旋律匹配,充分发挥两种算法的优势。同时,本文分析了提高系统执行效率的几种方式并简单介绍了GPU和CUDA,分析了使用CUDA来加速MATLAB执行速度的可行性和具体的操作流程。
其他文献
我国人口众多,人均耕地少,后备资源不足。近些年来随着工业化、城市化进程的加快,人地矛盾更加尖锐。为了缓解耕地保护的压力,提高用地效率,促进土地利用方式由粗放向集约转
现代悬索桥是由主缆和加劲梁构成的一种柔性悬吊体系,因其跨越能力大、造型轻盈等优点而成为特大跨度桥梁的首选。为确保悬索桥施工和运营期间的受力安全,论文以沪蓉西高速湖
本论文中设计合成了一系列新型的手性聚酰胺酰亚胺,并对聚合物的性能进行了分析研究。以手性氨基酸为手性源制备出一系列含有二肽的手性二酸,进而通过简单的缩聚反应得到了多
罗素的摹状词理论不仅对逻辑学做出重大的贡献,而且在哲学界也产生了巨大的影响,尤其对英美语言哲学的影响更是深远而持久,标志着逻辑哲学发展到了一个重要阶段。罗素在摹状词理
作为高氮CrMn奥氏体钢的典型代表,18Mn18Cr0.5N钢已广泛用于大型发电机护环。然而,这类钢护环在热锻过程中常常出现热锻表面开裂、混晶等问题。如何提高护环钢的成品率,数十
泛酸合成酶(Pantothenate Synthetase,PS)是泛酸合成途径中的关键限速酶。多种实验研究表明:泛酸对于结核菌的生长及其毒性至关重要。因而,泛酸合成酶成为开发抗结核药物的理想靶
阿根廷已经生产葡萄酒几个世纪,自从第一个欧洲殖民者引入藤扦插超过400年前。根据OIV(葡萄与葡萄酒国际组织)的统计,阿根廷是第五大葡萄酒生产国,在销量上仅次于法国,意大利
通用高分子材料的高性能化、高功能化研究是近年来高分子材料理论与应用研究领域的热点,具有十分重要的意义。与传统改性方法比较,纳米无机粒子具有许多特异的性能和功能,因
光纤放大器具有结构紧凑、可靠性高、光束质量好、转换效率高以及热管理方便等特点。近年来,随着高功率半导体激光泵浦技术和双包层光纤制作工艺的发展,光纤放大器的功率不断
数学问题提出的教学是对探究教学理论的再重视,数学问题提出方法的教研是贯彻落实新课程理念的要求,是教学实践的需要。问题提出的教研视角是:问题提出不只是作为问题解决的