AI用于视频编码有多有效?

来源 :传播与制作 | 被引量 : 0次 | 上传用户:luishifei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  当你思考人工智能(AI),具体地说能够完成历史上由人类智能完成的自主任务的软件时,会让人联想到天网(Skynet)——电影《终结者》里一个人类于20世纪后期创造的以计算机为基础的人工智能防御系统,它最初是研究用于军事的发展,后自我意识觉醒,视全人类为威胁,以诱发核弹攻击为起步发动了将整个人类置于灭绝边缘的审判日。
  这是虚构的。但在现实生活中,A I正在进入工作场所,包括压缩视频的编码、转码和解码。利用他们的程序内AI的能力,像Bitmovin、Cobalt Digital、MediaKind、Telestream和V-Nova这样的厂家正在降低带宽要求的同时加速他们的编码程序,从而为其客户提供更快、更经济实惠的产品。


  “A I正开始在编码中起重要作用,在此领域它具有显著改进工作流程的巨大潜力,”基于云的媒体流媒体技术开发商Bitmovin CEO和共同创始人斯蒂芬·莱德尔表示,“随着新编解码、新视频文件格式和分发方式的涌现,电视和媒体业需要以AI提供的自动化、即时和高效率方式改进编码的解决方案。”
  即便如此,就编码过程中AI的限制问题,厂家之间意见不一。AI(亦称为机器学习ML)无疑能够加速编码过程,但它能够做人类观察者能够做的一切,检测和整治压缩视频中的人工产物吗?没有人真正知道。
  人类无需参与编码出现后的复审阶段,因此在这个阶段提高了速度,记住这一点很重要。特纳媒体咨询公司保罗·特纳表示:“编码参数可设置为一组预定义的值,但你依然必须看结果且评估编码输出是否有足够好的质量。如果没有,你必须重复设置。”
  (顺便说明,ML为狭义版AI,其中AI赋能软件负责对预定义参数内的特定数据做出决定;而不是会自我感知和选择毁灭人类。本文章,我们将互换使用这两个术语。)
  AI如何能够改进编码
  当前的视频编解码使用算法分析视频图像,决定在不降低观众察觉的主观图像质量的条件下那些比特可以去除以减少文件尺寸。
  把AI注入此编码过程让该处理更进一步。A I允许软件在传输前前瞻性地评估压缩视频的质量。这让编码系统检测和纠正任何编解码器非故意产生的人工产物。在A I做此工作的过程中,它“学习”其行为,用此知识通过连续应用提高其性能。
  结果:“通过使用A I,编码解决方案能够做出关于每帧压缩设置和视觉参数的智能决定,加速处理和提高编码效率,”莱德尔说,“训练过的A I模型甚至能够预测每个特定源资产的最佳编码设置以及处理工具。”
  英国编解码开发商V-Nova CEO和共同创始人吉多·梅亚尔迪表示,A I用于编码还与其它方式。最常见的方式之一是增加现有编解码的预测能力,决定哪些比特可被安全移除。
  “你预测图像越好,最后剩下的需编码的就越少,”梅亚尔迪说,“因此在保证质量的前提下你必须通过输送管道发送的量也越少。”
  AI的局限
  在每个例子中,A I正通过自动质量控制努力改进视频制作过程。这意味着减少慢得多(且更昂贵)的人为干预,就能执行相同的任务。
  “你从根本上努力要做的是模仿人类评估,”Telestream CTO肖恩·卡纳汉表示,“你正在设法使用机器学习仿真观众感知内容质量的方式,并用它判断像‘我能更进一步提高码率或为保持主观质量不变我需要提高码率吗?’这样的问题。”
  这听起来是否令人望而生畏?是的。AI软件确实经过训练能够“寻找图像中人类观众会发现令人不快的东西,”卡纳汉说,“你正在训练一个机器找出不应在那里出现的东西。”
  这是A I赋能的视频编码局限性所在。“用软件一模一样模仿或尽最大努力表现人类视觉系统几乎不可能,”MediaKind(前爱立信媒体解决方案公司)产品管理副总裁卡尔·费格森表示,“20或30多年来人们一直在努力,但始终不成功,我认为永远没有人真的能够找到一个模仿得一模一样的人类视觉系统。”
  费格森说,问题在于相比基于度量的AI观看模式,人类观看具有主观性。“现实中人们认为图像质量较好,但测量工具给出的结果总是不尽相同,不管AI观看模型可能有多先进。”
  特纳说,质量评价不仅仅是关于绝对的图像质量;还有未经训练的人类观众意识不到的失真,“这也得纳入AI训练内。”
  这意味着A I注定在视频压缩中扮演一个次要角色?V-Nova的吉多·梅亚尔迪不怎么认为。即使有其局限,但他预测AI将成为“未来压缩引擎一个不可或缺的部分”。
  然而,在此技術能够真正与人类视觉系统的复杂性和精微玄妙性一致之前,人工介入将依然为高质量视频压缩一个必要的部分。AI至多不断降低人类必须介入以保障图像质量的实例比例。B&P
其他文献
[摘要]在融媒体环境下,短视频等新兴媒体的崛起在不断提升新媒体市场份额的同时,其收益的逐年增加也给广播等传统媒体带来了巨大冲击。在这种趋势下,传统媒体的转型和升级也逐渐趋向于产业化和商业化,但相比传输及时、互动性好、交互性强的新媒体,传统媒体的商业化运作难度却相对较高。鉴于此,文章主要剖析广播节目商业化运作转型面临的挑战,并就优化策略展开深入探讨,以期在不断提升传统媒体市场竞争力的同时,促进行业的
期刊
[摘要]网络空间已经成为人类语言生活的新居所,其对语言、社会和国家均有一定的影响,不仅存在非传统安全问题,也可能引发政治安全、军事安全等传统安全问题。文章从安全视角分析审视网络空间的语言生活,发现存在通用语言文字安全,交际符号的规范和优化安全,网络空间的语言技术安全,网络空间的话语传播安全,网络空间的语言关系安全等问题。文章以语言生活理念为思考路向,从国家安全视角提出四点治理建议和对策:动态治理,
期刊
[摘要]在碎片化阅读时代,浅层阅读现象普遍存在,呈现博而不精、读而不思、存而不论的困境表征。而全民阅读素养发展的困境会制约民族素质的提升,因此,推动碎片化阅读从浅层走向深入势在必行,这是时代赋予的任务。读·思·达作为完整的阅读过程,为碎片化阅读从浅层走向深入提供了一个有效视角。文章基于这一视角对碎片化阅读进行路径探究,深入分析原因并探寻对策,以期有效推动碎片化阅读从浅层走向深入,提升全民阅读素养。
期刊
[摘要]高校学报是我国学术期刊的重要组成部分,占据着学术期刊的半壁江山。然而,近20年来,高校学报发展还是存在一些问题,“全、散、弱、小”是高校学报,尤其是地方高校学报的普遍特点。“双一流”建设的启动给高校学报带了新契机,地方高校学报应围绕“双一流”建设,依托本校一流学科,突出地方性和育人性,压实编委会职责,调整编辑队伍结构,提高人才效能,实现地方高校学报的华丽转身。  [关键词] “双一流”;学
期刊
[摘要]近些年来,我国的经济实力得到了稳步的发展与增长,我国的图书产业也随之得到了长足的发展。当下,我国图书版权输出成为图书产业面临的重要挑战。我国的图书版权输出虽然取得了不错的成绩,但是还是存在一些问题,与发达国家的图书版权输出有着一定的差距。文章对我国图书版权输出时面临的问题进行分析,同时总结出相应的对策,以期为我国图书文化产业的进一步发展提供参考。  [关键词]图书版权;输出;策略  自从改
期刊
旨在探索付费电视和内容产业面临的最大挑战和机遇的“2019年付费电视创新论坛”调查结果表明欧洲和世界其它地区的付费电视业高管对应对OTT竞争和付费电视业的未来越来越乐观,并确定了该行业未来几年的五大重点。  首先是业界高管对付费电视行业重塑聚合模式的能力持乐观态度。他们认为为应对OTT服务的普及,其现有聚合模式必须与时俱进,而线性频道数量要减少,包括从线性观看转向点播观看。  其次,订阅OTT服务
期刊
[摘要]随着社交媒体的发展,人们使用抖音短视频的时长剧增,与此同时,抖音短视频的发展也给城市形象传播提供了非常大的机会,越来越多的城市因为抖音中的某个視频而成为“网红城市”。文章通过对抖音短视频中“网红城市”形成的原因、作用、特点及目前存在的问题进行分析,从而为“网红城市”的持续发展提供方案。  [关键词] “网红城市”;抖音短视频;城市形象  “网红”最初为“网络红人”简称,随着社交媒体的发展及
期刊
在今时今日的中国,观众收看4K HDR节目的机会越来越多,特别是一些超人气的电竞、演唱会纷纷采用4K HDR直播。引入4K HDR技术后,将现场的每一个灯光、舞美等视觉效果淋漓尽致地展现在收看端,画面上呈现更多的高光和暗部细节,图像拥有更强的立体感和层次感。超高清分辨率提升,画面透彻度无限接近于人眼视觉极限,而HDR高宽容度、高宽色域和高对比度,进一步扩展人眼的感官,带更接近真实环境中的视觉效果。
期刊
[摘要]当前,在传统媒体的转型与新媒体的发展下,媒体的融合发展与改革节奏正在加快甚至同频。新媒体平台下,直播、短视频等各类叙事形式层出不穷,丰富了人们获取信息的渠道与方式,其中最为突出的是Vlog(视频日志)。Vlog在短时间内不仅成为一种生活方式,还逐渐成为新媒体报道的传播方式。本文以时政Vlog的叙事结构为研究入口,分析传统媒体与Vlog碰撞融合,在场域、媒介和平台的变革作用下所产生的叙事结构
期刊
[摘要]近年来,新媒体技术蓬勃发展,人们获取信息和知识的渠道越来越多元化,已不再需要完全依赖于纸质书籍。这给传统出版行业的发展带来了很大的冲击。随着网络数字出版的快速发展,电子图书成为人们获取信息的新的方式,更好地满足了人们随时随地获取信息的需求。但从本质上看,数字出版与传统出版之间存在着密不可分的关系。科技期刊作为传统出版的一种类型,只有不断拓宽传播途径,才能赢得更大的生存空间。本文主要对数字出
期刊