多音轨MIDI音乐主旋律提取方法探析

来源 :科技创新导报 | 被引量 : 0次 | 上传用户:rilson
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘  要:MIDI技术具有灵活的演奏形式与超强的编辑能力,自20世纪80年代诞生以来,计算机音乐因为有了这个统一的接入标准以及在音乐制作上的便利性而得到了极大的发展。MIDI的主要特点在于其是一种数字文件,而非音频文件,是一种描述性的数据“音乐语言”,仅仅是记录了演奏乐曲的信息,因而占用的存储空间极小且便于编辑、修改。MIDI音乐主旋的提取除了在技术上的实践应用,更重要的是有利于音乐数据库的构建,对于多音轨MIDI音乐主旋律提取方法的探析有着一定的实践意义。
  关键词:多音轨  MIDI技术  主旋律提取  数字文件
  中图分类号:TP391.42 文献标识码:A 文章编号:1674-098X(2021)07(a)-0072-03
  On the Method of Extracting the Main Melody of
  Multi Track MIDI Music
  XIE Linling
  (Jinggangshan University, Ji'an, Jiangxi Province, 343009  China)
  Abstract: MIDI technology has flexible performance forms and super editing ability. Since its birth in the 1980s, computer music has been greatly developed because of this unified access standard and the convenience in music production. The main feature of MIDI is that it is a digital file, not an audio file. It is a descriptive data "music language", which only records the information of playing music, so it occupies very little storage space and is easy to edit and modify. In addition to the practical application in technology, the extraction of MIDI music theme is more important for the construction of music database. It has a certain practical significance for the analysis of multi track MIDI music theme extraction methods.
  Key Words: Multi track; MIDI technology; Theme melody extraction; Digital file
  MIDI音乐的出现,激发了电子音乐最为强大的潜能,浩瀚、丰富的音色资源与计算机的超级编辑功能结合在一起,可以任意剪辑拼贴、更换乐器、调整速度、音调,极大地提升了音乐创作、制作、剪辑的工作效率。带动了计算机音乐制作技术的进步,降低了专业音乐制作的门槛,促进了个人音乐工作室的诞生。随着科技的发展,个人计算机以及相关的MIDI设施的购买成本越来越低,因此,只要有想法,有能力,加上可以获得的相关软、硬件设施就能实现自己的音乐梦想。MIDI技术有着比其他任何传统乐器都更为丰富的演奏手段和难以想象的编辑能力。MIDI技术的发展,让音乐制作得到了普及,造福了一大批“网络音乐人”与“自由音乐人”。在MIDI研究过程中,对MIDI音乐的特点以及发展过程,让多音轨MIDI的各个轨道各自工作起来,从多音轨中提取主旋律进而构建数据库的方法等都是值得探討与分析的。
  1  MIDI音乐的特点及其发展
  MIDI的主要特点在于其是一种数字文件,而非音频文件,是一种描述性的数据“音乐语言”,仅仅是记录了演奏乐曲的信息,因而占用的存储空间极小且便于编辑、修改[1]。正因MIDI的这一特点,使其得到了飞速的发展与普及。对于国人而言,早期从事计算机音乐的人几乎都是从MIDI开始的,MIDI甚至是计算机音乐的代名词。MIDI到底是什么?简而言之,MIDI(Musical Instrument Digital Interface)即音乐数字设备接口,是一种数字化通信语言,一种使相关设备之间相互兼容并实现技术交流的技术标准。通过MIDI技术,音乐家可以像指挥家一样对自己作品的声音进行全面的控制和实时操控,无论是在制作室还是演出现场,MIDI技术都可以改变电子乐器、录音设备以及信号处理器等设备的参数,可以根据需求进行实时的操控,以呈现出最好的声音效果。
  20世纪80年代,电子科技的发展与计算机数字化技术的采用,推动了电子乐器的大发展,但是不同生产厂家之间的设备要进行同步是一件非常困难的事,因为每个厂家所生产设备的标准不一。为了解决设备之间的相互兼容性,MIDI标准被提上日程。1982年,国际乐器制造商协会通过了大卫·史密斯提出的“通用合成器接口”的方案,命名为“音乐设备数字接口”,即“MIDI”接口,1983年,MIDI协议1.0正式确定。从此,所有电子乐器背后都有了一个五孔MIDI插座,为乐器之间的相互兼容架起了一座桥梁,不同的乐器之间有了统一的连接规范,可以使用统一的“音乐语言”。自20世纪80年代MIDI诞生以来,计算机音乐因其有了统一的接入标准以及在音乐制作上的便利性而得到了巨大的发展,同时也为音乐界带来了一场重大的革命[2]。近年来,MIDI技术的重大变化在于采样音源的介入,采样音源是对传统乐器以及现实音效进行采录后而制作编辑的,其最大的特点在于其具有更加真实的效果和越来越大的容量。比如当下使用最为广泛的Kontakt采样器及所支持的音源,就Kontakt自带的原厂音源就有23GB,支持其格式的爱丽丝钢琴就占用了6GB(只是一种单独的纯钢琴音色)。另外,大众所熟知的好莱坞管弦乐,仅弦乐部分就有326GB,还有BFD鼓音源已经超过了100GB,足见当下采样音色所占用的存储容量,这也表明了在音乐制作领域无论是软件还是硬件都在飞速的发展。早期的MIDI音乐制作都是建立在GM音色表基础上的,虽然音色相对当下的采样音色差一点,但是其优势在于在任何音序软件中打开同一个MIDI文件都可以正常播放而基本不会出现乱码的情况。而随着音序软件及音源的不断发展,音序软件开始支持VST、DX、AU等多种格式,同时众多的音序软件生成的文件已然不是单纯的MIDI文件,而是有着自己的“工程文件”扩展名。如Cubase就以“cpr”作为扩展名,SONAR则是“cwp”为扩展名等。这些发展变迁都表明着当下的音序软件、MIDI音乐技术都朝着个性化和丰富性的方向延展,体现了MIDI音乐制作技术的实质性变化,使其逐步走向音源容量更大,效果更加精致,可调控性更强以及更加智能化。当下,几乎所有的音乐类型都脱离不了计算机音乐的相关技术,随着科技的不断发展,计算机音乐也在飞速的普及[3]。在今天,电子音乐已成为一种广为人知的艺术形式,并在高校中建立起了相对完整的学科体系[4]。音乐行业已然与MIDI技术不可分离,MIDI音乐主旋律的提取不仅在于技术上的应用,同时对于音乐数据库的构建有着极为重要的意义。   2  多音轨MIDI音乐主旋律的提取方法
  随着AI技术的不断变化更新,音乐创作的形式化技术也在其中得到了进一步的发展[5]。MIDI是音乐设备的数字接口,其电缆本身不带有音频数据信息,通过计算机向其他合成器等电子设备发出的MIDI信息是一些表演数据,以这种手段方式向其他乐器发出指令,进而控制其他操作系统。MIDI信息有许多不同的类型,大的方面来说,其包括了通道信息和系统信息。通道信息一般应用在MIDI的具体通道之中,而系统信息指的是整个系统的信息。当MIDI轨被编码为一个单独的统一体,这个统一体包括音乐音符和其他与演奏相关的事件信息。轨道内所包含的信息是可以通过创造性的方式分离出来,成为一个独立的音轨,用于诸如转调、重新分配乐器、数据库构建等。在当下的研究与实践应用中,MIDI主旋律的提取主要采用分层聚类算法、音轨特征量的方法。
  2.1 分层聚类算法的多音轨MIDI音乐主旋律提取方法
  随着计算机科学和音乐科技的发展,算法在计算机作曲领域已有广泛的研究和应用[6]。选择所有包含旋律音轨的方法來提取主旋律,被称为分层聚类算法。分层聚类算法是基于音轨之间的距离而建立起来的一个音轨的聚集。此方法可以从保存基本信息(音高信息和距离特征)的MIDI轨道中获得一个可选择的最佳音轨,进而从这个最佳音轨中提取主旋律。为了在提取主旋律时这一算法得以实现,需要经过以下6个步骤。第一,是对所要提取音乐中的所有音轨进行轮廓算法,而所谓的轮廓算法主要是应用在复调音乐中提取主旋律的一种方法,复调音乐是一种多旋律的音乐类型,一般来说,多条旋律都是主旋律,同等重要。因而,所谓的提取主旋律只是将所有音符聚集到一个音轨上,最好选择最高音的音符,得出具有一定特征的音高柱状图的音符集合。第二,是计算出每一音轨的平均信息,在这些平均信息中,得出最为突出的音符集,将其视为主旋律。第三,是将每一个音符分成十二平均律,以十二平均律的形式来描述每一个音符,进而计算出音高的柱状图。第四,是以音程的构建形成音符的聚集,实现音符的集合。音程是旋律运动的基本动力,通过音与音之间形成不同的距离(即音程度数),最终实现变幻莫测,丰富多彩的旋律组合。因而要提取旋律就需要对音程进行计算与分析,最终获得主旋律。第五,在以上四步完成后,基本得出旋律音轨,此时选择所获得的旋律音轨,然后再去除其余的聚集音轨。第六,再次运用轮廓算法对旋律音轨进行计算,获得最高的音高线条,得出音乐的主旋律。
  分层聚类算法是应用数学模型来计算聚集的旋律音轨之间的距离,在提取MIDI主旋律时关照到了不同乐器轨以及弱音高的音轨,极大地减少了主旋律提取时的误差,所提取的主旋律更为精细与准确。
  2.2 音轨特征量的多音轨MIDI音乐主旋律提取方法
  音乐制作者在运用MIDI创作音乐时,一般都会给每一个MIDI轨道命名,虽然并没有说一定要给MIDI轨道命名,但是通常为了便于修改与操作,基本都会给予MIDI轨道名称。名称明确就为主旋律的抽取提供了巨大的参考信息,同时也可以作为旋律音轨的特征向量来予以使用。一般的主旋律的音轨名称可能是Melodies(旋律)、Vocal(人声)、Solo(独奏)等。而其他的伴奏声部则有可能是吉他(Guitar)、贝斯(Bass)、Piano(钢琴)等。当然,也有名称模糊的时候,当音轨名称模糊时,也可以通过MIDI的通道号、左右声道的平衡度、MIDI音符的平均力度、音轨主音量的大小以及MIDI音符的发音时间、发音面积来推算主旋律音轨。
  无论是MIDI设备还是设备中的某个音源或者程序,只要被设定为响应某一乐器音色或者人声的通道号,即会响应这一通道上所传输的信息,比如人声、钢琴或者小提琴等。但是在16通道的MIDI音轨中,一般情况第10通道都是留给打击乐器的,所以根据这一固有特征,在进行主旋律轨选择时就可以排除第10通道。
  一般来说,所有的MIDI轨道都会作一个声像的平衡调节,以达到人耳在聆听音乐时的舒适度。对于主旋律音轨来说,通常情况下都会处于左右平衡的状态,即处于中间的位置。而其他乐器轨道在左右声像上多少都会有所偏差。这也可以作为一个特征向量来参考。除此之外,作为主旋律的MIDI轨中的音符的平均力度一般来说都会高于其他声部。为了突出主旋律的明确性,其主音量也会大于其他音轨的音量值。另外,主旋律的发音时间及发音面积(音长和音高)相比其他声部都会更容易被人们感知。
  在抓取与确定主旋律音轨的过程中,通过合理分析与选取各音轨的向量特征,建立分析模型,结合特征向量确定主旋律音轨。
  3  结语
  纵观电子音乐的发展历程,无论是合成技术还是后来的采样技术,其最终的目的无非是朝着两个方向发展,一方面是更为准确地再现自然声学的音响效果,即与MIDI技术紧密相连的部分,借助数字编辑的灵活度与强大功能,不断拓展音色范畴与真实性,可以模仿任何一件传统乐器的声音,如小提琴等。另一方面则是开拓新的“声音”,更为强调声音的新颖性与实验性。MIDI已经在音乐制作的各个领域内进行应用,MIDI技术在其灵活度与自由的编辑能力上高于任何传统乐器。在不断的发展中,MIDI技术越来越丰富,越来越体现出了自己的东西,逐渐走上了一条渐进式的创作之路。多音轨MIDI音乐主旋律的提取,对于在音乐数据库的构建上具有极大的意义,因此,对于其提取方法的探讨也有着一定的实践价值。
  参考文献
  [1] 黄枕宇.西方电子与计算机音乐史——电子、数据科技影响下的西方音乐[M].北京:中央音乐学院出版社,2020.
  [2] 谢林玲,李文韫.虚拟乐器人性化演奏效果的可实现性[J].科技资讯,2021(1):29-31.
  [3] 梁威.基于Kontakt采样器中虚拟乐器人性化效果的实现[J].科技创新导报,2020(29):87-90.
  [4] 赵晓雨.艺术理念与技术创新驱动下的中国电子音乐发展[J].中央音乐学院学报,2019(4):83-90,114.
  [5] 马丹,吴跃.基于生成对抗网络的智能音乐综述[J].计算机应用研究,2021,38(3):641-646.
  [6] 景宇阳.基于乐谱识别的深度学习算法作曲系统[D].南京:南京艺术学院,2020.
其他文献
摘 要:中药渣作为一种典型的工业生物质,具有含水量大、极易腐败的特点,处理不当易造成环境污染。采用热解技术处理中药渣不仅能减少中药渣对环境的污染,还可以生产有价值的绿色化学品和材料。本文详细回顾和阐述了中药渣类生物质热解的典型代表产物生物燃气、生物油和生物炭,并对其应用进行了梳理,同时概述了生物质微波热解工艺并预测其发展方向,充分证实了中药渣类生物质热解工艺具有一定的应用前景,对实现中药渣类生物质
期刊
摘 要:随着纳米气凝胶材料在保温性能上的突出表现,其在传统热网管道中的应用逐渐普及开来。然而,对于汽轮机主蒸汽管道而言,其温度更高,对气凝胶材料的厚度与保温能力提出了更高的要求。因此,研究气凝胶在机组主蒸汽管道中的应用具有重要意义。本文对气凝胶保温材料在机组主蒸汽管道中的应用进行分析,研究了高参数蒸汽管道保温层设计过程中采用气凝胶保温材料的具体设计方案及施工方法,并利用试验方法验证了保温效果。结果
期刊
摘 要:轴封系统是汽轮机的重要子系统,直接影响机组的安全性和经济性。某电厂300MW机组在完成切缸改造工作后,汽轮机轴封加热器水位产生了持续波动且逐渐恶化,导致轴封加热器频繁推出运行状态。通过制订不同的试验方案逐步排除了各部位的漏汽问题或切缸引发的副作用,并发现了疏水超过管道承载能力是造成水位波动的主要原因。通过改造疏水管路以增加轴加疏水的溢流能力有效解决了该故障。改造方案对同类型机组的类似问题有
期刊
摘 要:太阳能光热应用是利用太阳能最简单、最直接、最有效的途径之一,也是太阳能利用(尤其是发展中国家)的主要形式之一。目前,太阳能吸收体的吸收带宽和吸收效率都有待进一步提高。超表面具有可人为操控的电磁特性,通过改变超表面确切的尺寸、方向、布置和几何形状,可以在特定频率范围内达到理想的吸收效果。因此,超表面在太阳能光热方面有着重要的潜在应用价值。超表面的研究涉及多个学科的交叉,功能强大的仿真软件显得
期刊
摘 要:作为全球集成电路消费市场最大的国家,我国对集成电路配套装备的需求很大,而且随着我国集成电路设备领域科技的发展、技术的进步,进口设备部分必将成为国产化设备的巨大市场空间。本文针对以光刻机、化学机械研磨设备、离子注入机及湿法设备为代表的电子制造装备,依托Incopat专利数据库开展分析,包括电子制造装备领域专利态势、行业主要竞争者分析,提出关于我国电子制造装备领域的未来发展方向的建议。  关键
期刊
摘 要:由于传统资源回收方式存在各种弊端,建立一种新的资源回收模式迫在眉睫。“废变宝”平台将互联网技术与资源回收相结合,将线上下单预约等功能与线下资源回收模式充分融合,提供線上预约、捐赠、非遗文化宣传、志愿服务、反馈等功能。该平台有助于改变资源回收模式,提高资源回收的效率,改善可再利用资源的回收方式,将有效促进资源回收产业更好、更快地发展。  关键词:互联网+ 资源回收 垃圾分类 环境保护  中图
期刊
期刊
摘 要:随着时代的不断进步,在互联网不断发展的环境下,社会经济和科技水平都在不断提升,群众需求也有了明显改变,在这种环境下,通信行业的发展迎来了很大的进步。在过去的一段时间里,通信网络在发展过程中存在很多问题,对于用户的多样化需求难以满足,“互联网+”时代的到来有效改变了这一现状,对此有必要展开深入研究,结合实际情况探寻和总结新方法与新手段。  关键词:互联网+ 通信网络 网络模式 发展  中图分
期刊
摘 要:信息技术的发展推动组织商务模式的变革,业务协作日益频繁,为谋求组织利益的最大化,对部分资源与流程的共享提出更高的要求。如何满足交互需求的新的商业过程,是组织关注的热点问题。业务流程建模标注(BPMN)是业务流程管理领域的一种标准符号。在发布的BPMN2.0中,对象管理组织首次提出编排的概念。但是BPMN2.0编排中,具有多样性的元素组合特点,增加了语义分析的难度,可能出现不同结构与相同语义
期刊
摘 要:近年来随着我国社会与经济发展水平的显著提高,为科技的研究与应用营造了有利的环境。在先进的互联网信息技术的渗透作用下,融媒体时代悄然来临,广大受众对于广播电视行业的媒体服务提出了更加个性化的要求。在融媒体时代背景下,传统广电行业应积极采用新型技术进行自身的改革与创新,不断提高自身媒体服务质量,为受众带来更加优质的节目体验。本文对广播电视工程中的数字音频技术含义展开简要介绍,然后分析了数字音频
期刊