基于哼唱的MIDI音频检索算法研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:yuezhiyaodao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着音乐数据库爆炸式的增长,传统的基于文本的音频检索给用户带来极大的不便。基于哼唱的MIDI音乐检索是基于内容的音乐检索方式,它允许用户不需要歌词而只需哼唱旋律就可以检索到自己需要的歌曲。本文的目标是构建完整的基于哼唱的MIDI音频检索算法并检验其可行性。本文的主要研究内容如下:1.音频特征提取。分析了音频信号的时域、频域和倒谱特征,并介绍了几种基本的旋律轮廓的表达,阐述了音频信号的特征提取方法。2.基于HMM的哼唱检索算法。建立了以音符为基础的HMM模型,避免了音符切分。对音调进行转换,将音调转换后的音高序列作为旋律的音高特征,从而克服了因哼唱者哼唱习惯和音域差别导致的差异。用500个哼唱片段的测试集测试算法的性能,达到了 TOP3为78%的识别率。3.基于深度学习的哼唱检索算法。采用3层DBN网络结构得到每首歌曲的关键特征,保证旋律数据能精确描述歌曲旋律,解决了旋律特征不稳定的情况。并采用了基于聚类的方法实现旋律特征的近邻检索。构建了 200首MIDI格式的音乐库,用42首wav格式的哼唱查询文件验证算法的性能,达到了 TOP3为81.0%的识别率。同时引入基于DBN的哼唱检索算法与基于LSH的哼唱检索算法的对比实验,证明了基于DBN的检索算法的优良性能。上述两个算法的核心部分都包括旋律特征提取和旋律特征匹配,这也是各个检索算法着重研究的部分。MIDI音乐数据库的旋律特征提取和哼唱旋律特征提取相关技术在各个算法中都有着重研究。
其他文献
为了实现线路保护或闭锁功能而产生的不同变电站间的信息交换,变电站存在站间通信。一个完整的变电站自动化二次系统可以依据工程职责划分为不同的责任区域,该责任区域拥有它所包含IED的工程配置责任。IEC61850-6第二版将系统中的这样一个责任区域称为项目(project)。目前,IEC61850-6提出的变电站配置描述语言(SCL,SubstationConfiguration Description
课题源于国家自然科学基金项目“基于连续震源的煤层反射式槽波精细探测理论研究”。课题主要目的是对超低频弹性波接收信号进行处理,包括对直达波干扰和多界面杂波干扰的对
三次B样条曲线由于其优良的性质,广泛应用在图形绘制、加工、计算机图形学等领域。若将该曲线的绘制由嵌入式可重构技术来实现既可以缩短曲线插补的时间又可以降低成本。本设
面部表情识别技术是人工智能和模式识别领域的研究热点,同时也是一个具有挑战性的课题,涉及人机交互、计算机视觉、图像处理等领域,具有广阔的发展空间。但是由于表情特征易
精确检测水体盐度,在海洋资源的开发,农业环境的监测与治理,海洋气候预测,矿产勘测以及军事应用等方面都有重要的意义。目前发展比较成熟的盐度测量方法主要包括:电导率法、
无线传感网广泛运用于嵌入式领域,是由大量的低功耗、低成本节点构成的多跳自组织网络。IPv6是下一代互联网,研究基于IPv6的无线传感网络是无线传感网发展的趋势。6LoWPAN底层
目前,煤矿上的很多事故都发生在岩体裂缝的发育地带,这种区域地质情况复杂,因此,提前进行地质勘测显得尤为重要。数字式全景钻孔摄像技术可以获取孔壁全景图像进行地质分析,
微弱信号是指幅值比较小的有用信号,通常这类信号容易被强噪声所淹没。传统的微弱信号检测方法主要是基于滤除和抑制噪声,比如窄带滤波、小波分析、取样积分、相关检测等,这
北斗导航系统作为中国第一个自主研发的全新导航定位系统,不论从民用角度还是军用角度,都在我国信息建设的各领域发挥了重要作用。但伴随而来的干扰也日益加剧,为了保证北斗导航
随着技术的不断发展和生活水平的不断提高,人们对自家的安防要求越来越高,家庭安防系统使人们的生活更加方便和安全。传统家庭安防系统的布线比较繁琐,不仅系统的稳定性不高,