基于多模态情感回归的音乐检索的研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:liongliong545
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国互联网络信息中心(CNNIC)发布的近几年的《中国搜索引擎市场研究报告》中指出,网络音乐以其使用率一直位居中国互联网应用前三甲,大部分综合搜索引擎都已经提供针对音乐的垂直搜索功能。近年来有学者提出,用户偏向于使用描述音乐情感的词语来检索音乐,通过对情感的描述来检索音乐让用户觉得非常自然,并且能获得很高的满意度。作为音乐检索领域中的一种能获得较高用户满意度的检索方式,音乐情感检索具有很大的应用价值。音乐情感识别能够捕捉到人们对音乐的情感感知,对音乐情感检索具有极其重要的作用。近年来,音乐情感检索和音乐情感识别都取得了不少有价值的研究成果,也获得了越来越多研究者的关注。本研究分为两个部分:  第一部分可以细划分为以下四个方面的工作:首先搜集并标注了1687首中文歌曲作为歌曲数据集;然后进行了特征提取、特征融合、特征选择等一系列特征处理;接着改进Adaboost.R2算法并获得Adaboost.RM算法,并使用audio+MIDI+lyric多模态特征集训练得到了本文的音乐情感回归模型;最后构建了一系列实验证明了本文音乐情感回归模型的有效性,并进一步探讨了不同模态的特征对音乐情感回归的贡献以及多模态特征融合的有效性。  第二部分可以细划分为以下三个方面的工作:首先对第一部分的情感回归模型进行了泛化,也即使用第一部分的回归模型为2771首中文歌曲标注了PAD三维情感值;接着用这2771首带有情感标签的歌曲作为后台数据库,实现了对音乐的情感检索;最后开发了一个评价模块,邀请志愿者对模型泛化和情感检索的效果进行了评价。
其他文献
随着手写文字识别技术的快速发展,阿拉伯语文字分类已日益引起研究者的关注。有两种阿拉伯语文字识别系统:联机和脱机文字识别。对于联机文字识别系统,需要使用特殊的数字化
随着Web2.0的兴起,软件开发正在转变传统的服务观念,个性化业务大量涌现。然而移动性差、硬件成本高、资源扩展性差等问题制约了第三方业务开发的发展。而云计算恰恰在实现服
随着Internet的流行和发展,人们对于Internet的依赖也越来越强,对Web应用也有了更多的需求。传统Web应用的客户端主要是用来渲染服务端返回的HTML页面,功能单一,难以满足用户的交
互联网的蓬勃发展使距离不再成为人们认识彼此、交流信息的障碍,基于地域、爱好和理想等多种元素交汇的网络社区逐渐成为人们更加方便地获取信息的手段。虚拟的网络社区延续并
随着互联网技术的迅速发展和普及,尤其是社交网站和图像共享网站的不断推广和应用,网络上的图像数量呈现快速增长趋势。如何快速、准确地从海量的图像数据中检索到用户所需要
在计算环境从静态、封闭、可控逐步走向动态、开放、难控的过程中,软件呈现出一种新的形态——网构软件。网构软件的开放性给其服务质量的保障带来深层次的技术挑战。首先,网
粒计算是研究如何在问题求解过程中使用人类“粒度”和“粒”的思想的一门新兴学科,致力于探索基于粒度的理论、技术和工具,在过去十年中,它得到了很多研究者的关注。粒计算三元
随着移动技术的发展,智能手机等移动设备在日常生活中起到越来越重要的作用,但受限的资源始终制约着智能手机的计算能力。为了扩展移动设备的计算能力,弹性计算的概念被应用
约束满足问题(ConstraintSatisfactionProblem,简称CSP)简而言之就是由一组变量和一组约束组成的约束关系,求解约束满足问题就要为变量找到一组赋值而并不违反任何一个约束。
定位技术指的是运用某种无线通信网络平台,将收到的无线电波的某些参数如信号强度转化为定位节点与参考节点之间的距离,然后按照特定方法测得移动终端在某时段内所处的地理位置