基于挤压和激励残差网络的歌声检测

来源 :复旦学报:自然科学版 | 被引量 : 0次 | 上传用户:marsmoonhoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种基于挤压和激励残差网络的歌声检测算法,运用该算法,不需要对音乐信号进行复杂的特征工程处理,仅需对网络输入简单朴素的声学特征,便能通过多层次卷积以及挤压和激励操作,学习到更多的有效特征,从而达到比当前流行的检测算法更强的性能.算法中,残差结构使得网络可以轻松扩展深度,挤压和激励模块能对深度残差网络中学习到的多个特征进行自动融合,进而使得学习到的歌声特征整体更有效.为了验证算法的可行性和有效性,本文选择了2个公开的数据集进行实验,并以目前性能最好的歌声检测框架之一作为基线系统,实验结果证明了本算法
其他文献
音乐抄袭的客观评价旨在用客观方法评价音乐作品的相似度,这有助于执法机关判断音乐作品是否存在抄袭.本文提出一种基于旋律与节奏的整体相似度评价方法,并能指出所有相似片段.同时实现了一个音乐抄袭的客观评价系统MusicPlag,以高效的、可解释的、可视化的方式展示了音乐作品的相似之处.该客观评价系统只给出音乐作品的整体相似度,并呈现具体的相似片段,是否属于抄袭仍由法官确定.
新时期新型城镇化建设对适宜的人居人文环境提出了切实要求。运用GIS技术,基于夜间灯光遥感影像、交通矢量、兴趣点(POI)、统计年鉴等多源数据,以500 m×500 m栅格为基础单元,选取经济水平、交通通达、历史文化、公共服务等因子(权重分别为0.36、0.27、0.17、0.20),采用综合指数法构建人居环境人文适宜性评价模型,定量评价2017年安徽省人居环境人文适宜性。结果表明:(1)安徽省人居
时空融合技术是目前解决单一遥感数据源难以同步获取高时空分辨率数据的有效途径。然而,如何设置参数使模型融合效果最佳,如何设置在植被监测中广泛应用的植被指数的融合步骤,进而获得最佳的植被指数时序数据,目前仍不明晰。本文以长江中下游平原地区的典型县域—南昌县为例,基于Landsat和MODIS多时相数据对当前主流时空融合模型—ESTARFM(Enhanced Spatial and Temporal A
音符起始点是音乐特征信息中最基础的特征,也是高级音乐分析任务(如基频估计、节奏分析、节拍跟踪等)的前提.然而,目前大多数音符起始点检测算法的研究对象多以西洋乐(如钢琴、小提琴等)或人声为主,针对中国民乐的研究极为匮乏,其主要原因是缺少高质量的带标注的数据集.为此,本文采集了古筝的部分考级曲目的音频,并在专家指导下对音符起始点加以标注,率先构建了一个带标签的包含3529条记录的古筝音符起始点数据集.此外,由于传统的神经网络特征预处理方法无法凸显古筝音符的起始点特征,本文提出了一种新型的特征平滑处理方法ELE
利用模pq的欧拉商定义了周期为pq2的r元序列,并确定了该序列线性复杂度的精确值.结果表明,新序列具有高的线性复杂度,可以抵抗Berlekamp Massey算法的攻击.
把音频文件转化为自然语言序列后,使用mLSTM模型+softmax回归的深度学习网络对贝多芬钢琴奏鸣曲的创作时期进行分类,10折交叉验证的平均准确率可达到90%.这一工作说明创作于不同时期的贝多芬钢琴奏鸣曲的确呈现出不同的艺术特征,这一模型也可为其他的音乐分类问题提供新的思路.
随着网络技术的发展,网络舆情分析在应对突发事件中发挥的作用日益显著。自然灾害发生后,准确把握舆情信息传播特征并分析其影响因素有助于应急管理部门及时采取有效的应急救援措施。本文以台风"利奇马"为例,基于"新浪舆情通"系统搜集的相关微博、微信、论坛、网站等全网舆情数据,探究台风灾害全过程舆情信息的时空分布特征,开展灾害舆情信息影响因素相关性分析。研究表明:(1)相比于灰色EGM(1, 1)模型,ARI
黄土高原"千沟万壑"的地貌形态,在多尺度空间下表现出显著自相似性,具有"局部无规则,宏观有规律"的纹理特征。目前,黄土高原地形纹理的提取方法及应用已经得到初步发展,但依然缺乏在理论层面的框架体系。本文在已有学者研究成果的基础上,限定黄土高原为研究范围,明确提出黄土高原地形纹理的概念模型,即内涵、特征、分类及表达。将内涵进行扩展,除已有的宏观形态地形纹理外,提出黄土典型地貌单元(黄土塬、梁、峁等)特
本文主要研究音乐声的音色感知特征与情感的关联关系.首先通过多维尺度分析方法确定了一个5维的情感空间;然后针对72种音色的音阶素材和48种音色的旋律素材进行情感标注主观评价实验,得到音色素材的情感数据;按照演奏内容、时域特性以及乐器类型这3种因素进行分类,分别研究了音色感知特征和情感的相关关系;采用多维偏好分析方法和单因素方差分析方法,讨论了演奏内容、时域特性以及乐器类型这3种因素对音色感知特征与情感的影响;最后采用多元线性回归建立了一组音色感知特征与情感关系的数学模型.实验结果表明,音色感知特征是影响音乐
基于S-稳定性条件,建立了互补约束数学规划问题(MPCC)的二阶Mond-Weir型对偶模型.在二阶广义凸性假设下,证明了弱对偶定理,强对偶定理和严格逆对偶定理.给出了数值算例验证上