浅析人工智能技术在广播节目音频制作中的发展与应用

来源 :传播与制作 | 被引量 : 0次 | 上传用户:zhaimeng2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  自从谷歌的阿尔法狗“人工智能(下文称AI)”机器人程序在2016年击败了世界顶级围棋大师李世石以来,人们开始更加重视人工智能的发展。近年来人们的话题逐渐变成了谈论一个令人惊讶的事实,那就是一大批工作岗位即将很快被全新的AI机器人大师们所替代。几乎没有任何职业是安全的:从较为大众化的电话接线员、推销员、餐厅和商场服务人员到专业性较强的外科医生、律师、专业技术工种等等,甚至是广播影视节目制作人和音乐制作人们也要为此而开始担忧自己的前途了,因为聪明的AI算法很有可能很快就会使他们在工作中的角色变得多余。人们往往认为,偏艺术和情绪类的工作是最需要体现人性化的地方,也是最不容易被AI所取代的,然而从当今声音制作行业的种种发展迹象来看,AI已经在逐步影响整个广播节目制作的每个过程,从节目创作、演出到录音、混音和母带制作各个环节。也许我们会觉得在节目制作中加入自己的创意性成分是我们人类独有的技能,但无论你有什么特殊的技能,一个设计完善的AI程序所具有的深度学习功能将很快把你的特点给模仿下来。
  AI在生活中几乎无处不在。在西方国家,自动驾驶汽车和虚拟助手已经开始彻底改变人们的日常生活。在专业领域,广播节目的音频制作也逐渐成为了AI研究的沃土。AI到底是什么?在传统的数字音频工作站或数字信号处理插件中,都包含着由程序员们创建的一套指令系统。这些指令解释了我们人类在与软件交互时所提供的数据和用户反馈信息,并由软件来计算出结果。例如,当我们使用一个压缩器插件来处理一条人声轨时,插件会以一种可预测的方式来响应我们的参数设定和声音素材的动态起伏。这对我们的工作可能非常有用,但其产生的效果完全取决于我们如何设置压缩器的参数。因此不同的人声素材可能就需要不同的压缩比,或需要完全不同的另一套处理手法。这就表明传统音频软件完全无法帮助我们来做出这些处理决定,而需要我们利用自己过去的经验和学习到的技巧来判断新的录音素材该如何去处理。如果换成基于AI设计的压缩器,情况会有所不同。AI压缩器算法可以分析特定歌手的表现,将其与其他歌手的演唱大数据库进行比较并生成适当的压缩设置,以此给制作人提供良好的建议——AI软件可以模仿这些人类的认知技能。这样基于AI的压缩器不仅可以为用户提供如何设置压缩参数的建议,而且可以自行决定最佳的设置。通过对大量现有人声录音数据的采集和分析,AI软件将自己建立一个人们心目中“良好的人声压缩”这样的数学模型,并通过将这些学习模型与新的人声轨进行比较和适当应用。这样一来AI压缩器就是基于自己的学习经验来进行判断,而不是我们给它的经验。在前人的人声制作成品中去学习经验模型并自动调整出自己的阈值、压缩比、启动释放时间等一系列设置,而无需我们用户告知自己过去的经验或决策,这样的行为特点就是典型的AI机器学习。这些概念同样适用于許多其它节目制作场景,并且已经在深刻改变我们制作音频节目的种种方式,同时AI技术已经悄悄的在编曲创作和母带制作等领域也产生着重大影响。
  在节目的编曲和创作上,AI引擎会聆听用户的声音,就算用户没有具备基础的乐理知识或是作曲编曲知识也不用担心,AI会将他们随口哼唱的旋律变成他们最喜爱的歌曲风格,只需几秒钟就可以,甚至可以在手机上就能完成这样的创作并即时播放出来。因为AI强大的学习功能会随时记录用户所哼唱的旋律和选择的节奏类型,并应用相应的AI算法来编排器乐并演奏出来,同时制作出一系列乐器轨道。用户只需要轻松哼出自己的曲调,并在交互界面中选择自己需要的风格类型就可以。这给节目的编曲和创作工作带来了极大的方便和丰富的灵感!同时,不仅是普通用户,许许多多的知名艺术家也在与AI引擎的开发企业进行密切合作,不断添加新的音乐风格类型,并且AI的学习算法也在不断的发展壮大。将来甚至可以做到在没有任何音乐培训、录音室设备投入和聘用音乐制作人成本的情况下,将节目专业而高效的制作出来。
  在节目的母带处理环节,AI引擎的工作也是可圈可点。目前已经有好几家国外公司开始提供在线的自动化AI母带制作服务。基于AI技术的母带处理引擎可以很好的“聆听”未经处理的歌曲,准确识别该风格类型并应用合适的母带均衡器、多段压缩器和其他必要的处理手段,所有这些工作过程都无需人工干预。同时这种处理也是自适应的,通过在整个音轨中不断的调整均衡、压缩和其它处理工具来适应歌曲的风格和用户的需求。AI引擎每次遇到新的音乐风格时,由于它的自主学习算法,它都会学到新的“知识”并且让自己变得更好。AI技术正在以非常专业的水平掌握着各种各样的声音制作技巧,并且可以做到即便是专业人士也很难分辨一首歌是由真人工程师还是由AI来进行母带处理的——可见AI引擎在过去的几年里已经迅速达到了相当高的复杂程度。而越来越多专业和非专业用户的参与也会让AI变得越来越强大,不久的将来很可能会超过专业音乐工作室和录音棚的效率,真正开始满足大众化艺术制作的需求了。同时AI设计和制造公司们为AI参与的音频制作建立的强大而开放的网络环境,也让所有节目内容制作者能够低门槛、高效率、高质量的制作音乐节目。随着AI的发展,这样的制作环境和概念也许即将变成一种主流,任何需要复杂处理的事情都可以交给AI来完成,而无需人类音频工程师的参与。






  因此,AI已经能通过自主学习,自动掌握优化原始音频的一系列技术手段。基于这种强大的机能,相关的科技公司正在开发基于云端的AI生态系统。让所有注册用户在其中可以随意调用AI服务来帮助自己完成任何节目制作任务,包括乐曲的创作和演奏、声音的产生与合成、音乐的混音和母带制作等等一系列工作。未来的节目制作人角色,实际会变成利用多种AI算法来执行特定的节目制作任务这样一种形态。这些AI算法将逐步学习、适应和理解制作人的各种声音需求,从而做出能给人内心带来共鸣的最佳选择。而那些经验特别丰富的节目制作人还可以通过优化和训练AI算法,来达成特定的制作技巧。例如:如何针对特定风格的打击乐或者弦乐来使用均衡器。这也将成为这个AI生态系统的一个重要组成部分。同时,其他用户也可以对此均衡算法的质量进行打分评级,进一步加深优化整个系统的运行。此外,用户们还可以通过上传具有自己风格特征的节目素材库来构建和充实整个AI算法,并以此训练AI的学习模型,评估所得新算法的质量以确保高质高效的运转。这样对于那些重复度极高的手工制作任务,也无需制作人投入数十甚至上百小时才能完成,全部交给训练好的AI引擎去自动处理就可以了!人们可以将更多的时间留给创意性思维。   如果将来AI能发展到几秒钟内制作出一张唱片或者一部广播节目,这是否意味着音乐家和节目制作人们将失去工作呢?同时人类的创造性思维会不会因为AI的帮助而变得越来越懒惰和不再具有任何作用呢?现在还不得而知。实际上AI作为一个很好的辅助工具,或是可以称为提高制作人创造力的一种工具,最大的问题在于它所做的一切都是学习和复制前人创造出的内容,但声音制作的特殊之处恰恰在于它的创新性和独创性——人类的创造性思维是会不断推陈出新的。但在这个过程中,人类的思维往往会被一些生理和心理因素所局限,这个时候AI就是我们的好伙伴、好帮手了。创造AI这个工具的目标,并不一定是要替代任何人所做的事情,更有可能是为了构建一种良好而高效的工具供人们使用。


  并且将这种世界性的、大众化的创作理念尽可能延伸到我們生活的方方面面,创造一种全新的艺术氛围和环境。几百年前如果人们需要创作音乐,就需要先花费大量时间精力去学习音乐理论并使用纸和笔来将自己的音乐写下来,同时费尽心思寻找演奏家或是赞助商来将你的作品表达给世人欣赏。而现在这个门槛降低了许多,人们只需掌握很少的技术或是专业知识,有智能手机、智能制作软件,甚至是AI的协助,简单的表达出自己的创造性思维,就能自动生成所需的音乐。但这样的大众参与并不会影响专业音乐制作人的工作。这就好比当年电子合成器刚被发明出来时,每个人都在担心现场演奏的音乐家们要失业了,但事到如今传统的管弦乐队依然存在和发展着。
  因此,随着科学技术的进步,我们表达自己所需的技术条件的确在大幅下降,从笔和纸到磁带再到数字化再到移动化创作,所有的制作都在变得越来越轻松,同时也有越来越多的人参与到这样的创作中来,人们的想法也越来越容易变为现实。那么可以预见的是,AI肯定会在未来的制作过程中发挥极大的作用,它将会给人们的创意思维和创造性带来爆发式的增长,同时,音乐家和声音节目制作人们也会因此拥有更多时间进行创作并以全新的方式来创造出自己的作品,而将那些繁琐重复的基础任务全部留给AI去完成。基于云端的节目制作也很可能变成人们在线互动娱乐的一个重要组成部分,广大消费者们也可以通过基于AI的生态系统来创造和分享自己全新的音乐,世界即将迎来一个全新的“AI时代”。B&P
其他文献
序言  业界周知,播出系统是全台最复杂、安全性要求最高的系统,而数据库的安全稳定运行则是播出系统的核心要素之一。在设计建设播出系统时,我们始终致力使数据库安全稳定运行。但在现实场景中,由于数据库故障导致的播出事故仍然常发,影响程度轻重不一,严重时将导致大面积长时间停播,恢复时间较长。本文就播出系统数据库的几个经典架构展开讨论,供读者参考。  一.共享盘阵双机热备数据库  双机热备数据库架构见图1,
期刊
过去几十年里,音频技术多次改变了面貌。不过,迄今为止最大的变化是从模拟转换到数字,并且一旦音频被转换为比特和字节,它就使我们能够做过去似乎匪夷所思的事情。我们不仅不再线性录音,而且我們中的大部分人不再以线性方式工作,随机访问现在为我们录音、工作和生活的方式。  我们当前正经历音频业另一巨大的转变,现在音频技术能够增强用户体验,促进质量提高或增加个体隔离性,以及往往以质量为代价的即时交付。以下的技术
期刊
感谢美国,感谢特朗普,中兴事件让我们知道了芯片的重要性,华为事件让我们知道了5G的重要性,特别是这两个事件让我们都知道了拥有核心技术的重要性。  上个月的世界移动大会上,5G风头正健。各国各公司都在5G部署上快马加鞭。高速率、低延迟、高容量的5G网络对广播电视台有巨大的潜力,因此当前广播电视台明智的做法是尽快了解和掌握5G技术以及它如何影响广电业的发展。  5G时代,内容依然为王,而视频是5G的杀
期刊
一.前言  随着IT技术发展的日新月异,近年来以云计算为代表的互联网技术迅猛发展。特别是3G、4G等高速移动互联网的快速普及,让人们获取信息的途径由以前传统的媒体通道(如:广播、电视、报纸等),逐渐转变为手机、PAD等移动互联网终端。各类型的新型媒体,借助智能手机平板电脑的快速普及,赢得了众多受众的喜爱。新型媒体的发展之迅猛,传播范围之广泛,都大大超出了媒体人的预料,给传统媒体带来了前所未有的冲击
期刊
未来实用的新技术  沉浸式音频你怎么搞?看过来  完全沉浸式音频利用更多的可定址音箱增加音频分辨率,允许有特定的定位和现实感。在传统的混音环境中,这意味着多得多的声道!  此方式的问题是随着声道数量增加,复杂性也随之增加,导致不能很好地适用于不同系统结构的难处理的混音。虽然对可有效地缩混为立体声的5.1原声来说这是可管理的,但对22.2电影版本来说,同样的情况不会出现。  人工智能进入广播领域  
期刊
在过去的12个月内,DAB到达了一些重要的里程碑。在全世界,超过4.75亿人现在享有DAB服务,售出的收音机超过7000万台。  在欧洲,DAB+被稳固地确定为未来广播核心平台。去年挪威完成了数字转换,瑞士将从2020年开始,而英国数字收听率达到50%以上,英国政府将评估数字广播进程,在适当时间决定下一步如何走。  转换  在挪威数字转换后,我们看到收听数字稳定并且显然听众喜欢他们的新广播电台。旧
期刊
政策·标准·动向  广电总局与亚太广播联盟(ABU)签署合作框架协议  中央宣传部副部长,国家广播电视总局局长、党组书记聂辰席和国家广播电视总局副局长、党组成员范卫平同亚太广播联盟秘书长贾瓦德·莫塔吉博士进行了正式会晤。在这次会晤中,范卫平和莫塔吉博士签署了国家广播电视总局(NRTA)和亚太广播联盟(ABU)之间的合作框架协议。  两家机构同意在若干重点领域开展合作,包括政策信息、新闻制作、节目制
期刊
CCBN2019将全面展示广播电视行业采集制作、集成播控、传输覆盖、运营管理、终端服务等各类技术设备和创新应用,以及新媒体、网络视听、电影、信息化视听、数字出版、通信、IT、电子等创新技术产品与融合应用。本届展览有以下几个特点:  1.聚焦全媒体时代媒体深度融合和智慧广电创新发展  本届展会将重点关注媒体融合发展和智慧广电建设,为推进广播电视深化改革、转型升级提供平台支撑。  媒体融合方面,将全面
期刊
【摘要】 沈阳广电传媒集团研发的艺卡智能移动拍摄系统(以下简称艺卡)于2018年8月研发成功,10月在公共频道200演播室试运行,2018年9月广电总局规划院广电计量检测中心对该系统进行了测试和验证。本文对艺卡涉及的相关技术、系统架构及系统软件进行了详述。艺卡的成功研发与应用,为广播电视制作智能化提升推进提供有益的借鉴。  【关键词】 演播室智能拍摄 精准拍摄 拍摄主体跟踪 无轨移动 微距运动拍摄
期刊
产品创新杰出奖- UHC-8300 8K系统摄像机  8K成像器件的研发早在多年前就开始了,现在索尼将这一尖端成像技术带入到直播制作中,推出了采用3片(RGB)8K分辨率成像器件的系统摄像机:UHC-8300 8K系统摄像机和配套使用的UHCU-8300摄像机控制单元。将8K带入广播电视直播制作流程。  UHC-8300摄像机系统支持H工DR制作,并且支持SR-LIVE工作流程,使得8K HDR和
期刊