基于生成对抗网络的音乐流派转换研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:kensenwey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音乐流派转换是指在保留音乐整体内容的基础上,对两种或多种流派音乐进行风格或者演奏乐器转换。音乐流派转换研究可以启发音乐创作者的灵感,是人工智能众多领域中的一个重要研究课题。现有音乐流派转换模型主要实现了两类流派音乐间的转换,对于多流派间转换主要通过反复建立两类间转换模型来实现。这种方式易导致模型多,实际应用复杂等问题。基于此,本文针对多种流派音乐间的转换问题开展研究,主要工作如下:(1)提出了一种多流派音乐转换模型MMT-Star GAN。针对多类流派间转换需反复建立两类间转换模型的问题,该模型基于Star GAN思想,使用音乐的梅尔频谱图和随机目标流派标签训练一个通用的生成器生成指定流派的梅尔频谱图,并训练一个判别器同时判断梅尔频谱图的真实性和流派类型,能够将任意时长的原始流派音乐转换成多种目标流派,实现了多流派间转换。(2)针对现有模型采用循环一致性损失保留原始音乐内容会引入多余噪声的问题,MMT-Star GAN模型引入一个内容保留网络代替原始Star GAN中循环一致性损失,来约束转换前后的特征向量,使其尽可能地相等,提升了对原始音乐整体内容的保留效果。同时,为提升转换质量,引入子像素卷积网络代替原始Star GAN生成器中的反卷积网络。(3)提出了一种损失函数动态权重方案。针对现有模型倾向于学习差异明显的流派音乐之间的转换,在相似流派音乐之间的转换效果较差的问题,本文将音乐流派间的差异性作为权重纳入到损失函数计算中,对于差异小的流派给予较大权重值,从而有效增大了相似流派音乐间损失,提升了模型的转换效果。同时,为稳定模型训练,引入铰链损失代替原始Star GAN中的对抗损失,并对生成器和判别器网络中的所有卷积核采用谱归一化操作。(4)分别在流派音乐数据集GTZAN和乐器音乐数据集415-CTI上对MMT-Star GAN进行了实验,并引入客观分类准确率以及主观内容相似度和吸引力指标对实验结果进行评价。实验结果表明,本模型相比基于原始Star GAN的模型,在相似流派之间的音乐转换结果获得了更高的客观分类准确率,以及更高的主观内容相似度和吸引力评分。同时,在多种乐器间的音乐转换结果表现出较高的客观分类准确率和主观评分。
其他文献
目的:探讨细胞周期蛋白A1(CyclinA1)、三磷酸腺苷酶家族蛋白2(ATPase family AAA domain containing 2,ATAD2)在胃不同上皮性病变中的表达情况,尤其是探讨两者单独或联合表达在辅助鉴别胃粘膜高级别上皮内瘤变与高分化胃腺癌中的临床应用价值;同时探讨两者在进展期胃腺癌患者中的表达与临床病理特征和预后的关系。方法:运用免疫组织化学(immunohistoch
蛋白质翻译后修饰是指蛋白质合成后发生的化学变化。它可以影响蛋白质的结构、亲电性,控制蛋白质稳定性、定位等关键机制,并调节众多生物学功能。近年来,在不同物种中发现了赖氨酸2-羟基异丁酰化修饰(Lysine 2-hydroxyisobutyrylation,Khib)。进一步研究发现,Khib修饰具有多种生物学功能,参与不同的信号或代谢等通路,包括氨基酸的生物合成、碳代谢、糖酵解和转录等。为系统地了解
目的:探讨中医传统运动八段锦对乳腺癌患者癌因性疲乏及相关因素的干预效果。方法:按照便利抽样法,将2020年1月~2020年6月和2020年7月~2020年12月入院的符合纳入标准的对象设为常规康复组和八段锦辅助康复组,每组70例,八段锦辅助康复组患者在常规治疗护理基础上参与八段锦锻炼,常规康复组进行常规治疗护理。通过实验,以问卷调查方式对比研究不同组别乳腺癌患者癌因性疲乏与生存质量及睡眠质量。结果
三维数据配准是计算机视觉的基本问题,所谓配准就是变换目标数据使得目标数据和参考数据的点集之间精确配准,它是颅面复原、性别鉴定、民族分类等的基础。三维颅面数据形状和姿态各异,采集方式和环境不同导致点数不一致,部分数据存在非刚性形变,定义和提取颅面数据的特征比较困难,所以要获得精准匹配的配准结果是比较有挑战性的工作。特征点的标定是其中重要的一环,传统手工标定的方法费时费力而且不准确。由于近年来卷积神经
目的:检测结直肠癌组织细胞中micro RNA-375(miR-375)的表达情况以及与疾病进展的关系,并用慢病毒载体构建miR-375过表达的结直肠癌细胞HCT116,研究miR-375过表达与CIP2A/PP2A到Akt/p-Akt的信号通路之间的关系,以及对结直肠癌的侵袭、迁移、增殖、凋亡等细胞形态学过程产生影响。方法:从临床获取30份临床结直肠癌患者的癌组织和癌旁组织以及购买的三种结直肠癌
DNA作为一种内源性生物材料,由于其可编程性、可预测性和良好的生物相容性等优点,已广泛用于构建新型纳米生物载体。目前,利用DNA纳米技术已构建多种尺寸、形貌可控,且对环境刺激特异性响应的核酸纳米机器,并应用于生物成像、生物传感、药物精准输送等领域。本文基于核酸适配体、DNAzyme等功能核酸构建了一种多功能DNA-Au纳米机器,由肿瘤微环境谷胱甘肽(GSH)引发药物释放和纳米金(Au NPs)聚集
目的:舌鳞状细胞癌(tongue squamous cell carcinoma,TSCC)是口腔癌中发病率最高的疾病。RhoE作为Rho家族成员,目前被证实在多种肿瘤细胞中表达失调,然而对RhoE在舌鳞状细胞癌中表达量变化的研究较少。本实验目的是检测RhoE在舌鳞状细胞癌组织和癌旁组织中的表达变化,结合临床数据分析RhoE表达改变对舌鳞状细胞癌的临床意义,并初步探究机制。方法:收集青岛市市立医院
齿轮箱是旋转机械的关键传动部件,其运行状态将直接影响旋转机械的安全与稳定。一旦出现故障,轻则影响效益,重则导致机毁人亡。齿轮箱通常需要高负荷连续运转,运行环境复杂,导致其产生故障的诱因较多,从而故障概率较高。而齿轮箱中发生故障概率较高的部件当属齿轮和轴承,因此本文将齿轮箱中的主要部件齿轮与轴承作为研究对象,以极限学习机为基础,对特征提取、智能优化算法和模式识别展开研究。主要内容概括如下:针对齿轮箱
信息时代的迅速发展,为人们提供了诸多便利,但是大量的数据同时也给人们带来一定的困扰,导致用户选择信息比较困难,因此推荐系统的出现就是为了帮助人们解决这一出现的问题。由于每个用户都存在于各种社交关系中,所以将社交关系与推荐系统进行结合成为可以有效的帮助人们得到自己想要的信息。现实世界中用户不可能存在于一种社交关系中,并且对于该用户来说,并且每一种社交关系对推荐效果产生的作用也是存在差别的,但现有的社
研究目的:微波消融术(microwave ablation,MWA)是局部热消融治疗的一种,也是除手术切除外的第二种可能达到根治效果的治疗方法,具有创伤小、可重复、对肝功能影响小等优点。由于微波消融术后无法获得完整病理标本以验证肿瘤是否完全根治,对消融范围的准确掌握尤为重要。本研究探究在单发且直径小于3cm肿瘤的活体实验中使用不同功率微波消融的实际作用范围,为未来临床消融治疗操作提供参考。研究方法