顺滑如丝 解密英伟达慢动作视频技术

来源 :电脑爱好者 | 被引量 : 0次 | 上传用户:zengquaner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读


世界杯上的VAR逐帧回看


英伟达演示网球拍击打有颜色的墨水瞬间

慢动作 没你想象的那么简单


  相信大家在各种影视作品中都看到过慢动作特效,比如在刚刚结束的世界杯上就有许多球员进球、射门、身体接触的慢动作回放,通过VAR逐帧回看这些慢动作可以清晰看到一瞬间发生的事情(图1)。
  对于电影里的慢动作特效,实际上是借助设备进行高速摄影,比如拍摄速度达到50帧/秒、100帧/秒甚至更高,然后在回放时仍然选择24帧/秒常规速度播放,这就相当于把实际1秒钟拍摄的图像用2秒多到4秒多的时间回放,从而实现慢动作效果。
  当然对于普通用户来说,我们没有高速摄影设备,怎么能实现慢动作效果呢?英伟达近日推出了基于cuDNN加速的PyTorch深度学习框架实现任意视频慢动作的技术,通过这个人工智能框架,结合NVIDIA Tesla V100 GPU强大的处理能力,它可以将任意一段视频拉长,从而实现类似电影特效里的慢动作(图2)。
  视频拉长的背后——人工智能慢动作技术
  通过上面的介绍我们知道,常规的慢动作是将高速摄影的视频低速播放而实现。那么对于普通的视频(已经是低速摄影成品了),英伟达又是怎样实现慢动作效果的呢?
  慢动作的核心是将原来的视频拉长而实现慢速效果,但是如果将普通的视频直接使用低速效果播放,实际效果则会变得卡顿,帧与帧之间动作变得不连贯。因此将普通的视频拉长后还要实现平滑的慢动作效果,此时就需要对视频物体进行定位和补帧。
  比如一段汽车漂移的视频,如果要实现漂移的慢动作演示,我们首先需要对视频中的汽车进行准确定位,比如精确定位汽车每一秒的漂移位置,这样才可以对汽车后续整个漂移动作进行全程的展示(图3)。


漂移汽车

  因为原来的视频本身就是低速摄影拍摄的,现在将视频拉长后,为了让拉长的视频不出现卡顿(掉帧),就需要进行精确的补帧,使得视频拉长后播放仍然非常顺滑(图4)。
  这样通过视频定位和补帧,英伟达的人工智能框架技术就实现了将任意视频慢动作化。那么这样的效果是怎样实现的呢?
  英伟达的这项技术是借助NVIDIA Tesla V100 GPU强大的视频处理能力+人工智能学习框架实现的。英伟达搭建好人工智能学习框架后,把预先准备的约1.1万段视频素材作为数据源,提供给人工智能进行学习,让它从这些视频素材中学习定位和补帧。比如上述跳舞视频,人工智能技术可以对视频中的舞者进行定位,并且可以对舞者每一帧动作进行学习,知道下一帧的人物是怎样的状态显示。这样通过一定的算法和学习模型,并且经过人工智能的深度学习和自我学习,这个人工智能框架就可以对其他视频进行同样的定位和分解,用完美的定位和补帧技术,实现将普通视频慢动作化(图5)。


英伟达展示舞蹈演员跳舞的慢动作视频


英伟达展示人从高空跳下压破气球瞬间慢动作

  当然不仅仅是视频慢动作,借助新的训练方式,人工智能还可以从已有的图像中生成新的图像,甚至可以利用不同的人像生成新的肖像。就像影片中的换脸特效一样,英伟达的人工智能框架可以精准地实现人物从一个人脸无缝转换到另一个人脸的特效(图6)。


英伟达展示变脸特效

慢动作 带给我们更多乐趣


  通过上面的展示,我们见识了英伟达人工智能框架在视频处理方面的强大功能。这个技术的出现可以给我们的生活带来很多乐趣。
  随着手机的普及,我們使用手机来拍摄短视频,对于那些稍纵即逝的画面,我们总想看清楚整个过程。比如喜欢跳广场舞的老妈,对于队友、教练的快舞节奏总是看不清楚整个动作,现在只要使用手机拍摄,然后借助英伟达这个技术转换,舞者再快的动作都可以变慢,让老妈仔细看清楚每个舞蹈的动作。
  英伟达的变脸技术则可以让我们在手机上制作出更多的搞笑视频,比如将舍友变成可爱的猫咪,然后通过微信、朋友圈和好友共享。当然这些技术也可以让我们的视频处理变得更为简单,比如剪辑钢琴老师弹琴的动作,方便我们学习指法;剪辑球员射门的视频,让我们细细欣赏漂亮的射门!
其他文献
曦力家族收缩战线  Helio又称“曦力”(图1),是联发科在2015年推出的中文品牌,寓意Helio处理器如同太阳般带给全世界人类力量与动能,让每个人得以发挥自己真正的潜能,创造无限可能。当时,曦力家族被细分为Helio X和Helio P两大家族,前者曾摘下全球首款十核移动处理器(Helio X20)的桂冠,但由于Helio X30的失利,让联发科不得不收缩防线,短期内不再染指高端市场。而为了
期刊
很多喜欢看电子书的用户都非常羡慕拥有Kindle一类的阅读器,黑白色的电子墨水屏幕省电还护眼,长时间看起书来非常惬意。实际上,我们的手机也可以秒变黑白显示的“墨水屏”,带来不一样的视觉体验。  首先,我们需要进入“系统→設置→关于手机”,连续点击版本号激活开发者模式。然后进入开发者选项,找到“模拟颜色空间”(图1)。点击这个选项,并将其设定在“全色盲”模式(图2),你就会发现整个手机屏幕失去了色彩
期刊
1. 自动提醒 编前转为最佳格式  运行软件Shotcut后,首先添加要处理的视频文件。添加视频时,如果软件检测到现有的视频文件为可变帧速(对视频编辑不可靠),会提醒将该文件转换为一种更加适合于编辑的格式。  这时,可通过下方的滑块选择三个档次的格式。其中“好”为有损H.264/ AAC MP4格式,文件大小中等;“更好”为稍有损失的ProRes/ALAC MOV格式,文件更大;“最好”为无损的F
期刊
Q:现在用移动支付的时候越来越多,而微信钱包就是其中最主要的方式之一,但是如果手机不小心遗失,其他人就可能转移微信钱包中的钱款。有什么方法可以有效地进行保护?  A:打开微信钱包,点击界面右上角的按钮,在弹出的“支付中心”列表中选择“支付安全”选项。这样就可以看到“钱包锁”的选项,将其打开以后,只有输入对应的密码才能进入微信钱包的操作界面。  也可以选择其他的“支付安全”选项进行保护。让手机不在炎
期刊
单纯的指纹密码  对Android手机来说,当我们设置锁屏密码(包括简单数字、图案、带字符的复杂密码)以及指纹和面部识别信息后,依旧存在被人破解的可能。首先,就是你早前激活且打开了开发者选项中的USB调试模式,此时当手机被人拾到或盗取后,可以通过PC端软件使用ADB命令删除锁屏密码,如此一来你手机中保存的照片和个人隐私信息就全部暴露了出来。  如果你没有打开 USB调试模式,对方只能获得你手机的使
期刊
文本格式的潜能  正常情况下,通过修改文本的格式,就能制作出精美的文本。特别是在PowerPoint 2007以后,“艺术字样式库”中就有不少内置的特效字样式,用起来非常方便。  切换到“插入”选项,单击“文本框”,在里面输入文字:2018,然后切换到“格式”选项卡,在“艺术字样式”中可以任选内置的特效(图1),单击“文字效果”可以添加阴影、映像、发光、棱台等特效,并且每种效果是可以进行修改的,从
期刊
添加允许访问的软件  首先访问S i m p l e w a l l防火墙的官方网站(ht t p s: // w w w. henrypp.org/),在左侧列表中找到这款软件的名称链接后,点击它,在右侧窗口中就可以看到它的最新版本。官方网站提供了软件的安装版以及便携版两个版本,用户可以根据自己的需要来进行选择。我这里直接选择便携版,解压以后就能直接使用了。和其他的防火墙软件一样,Simplew
期刊
不过在把新的SSD装上电脑后,有些人会发现系统并没有正确识别它,或者虽然SSD能用,但原先的PCI-E声卡或显卡突然失效了。这是怎么回事呢?原因就在于M.2接口与PCI-E插槽采用了“共享”PCI-E通道的方式。 PCI-E通道是什么  P C I - E的全称为P C I -Express,是现在主板上最主要的设备通讯协议,它是一种点对点通信协议,既可以使用单个通信通道,也可以组合使用,我们说的
期刊
如果你喜歡玩《守望先锋》,配备MX150的轻薄本就足以胜任;如果你喜欢《绝地求生》,那武装GTX1050 Ti独显的游戏本才算入门。要是你有着外接2K或更高分辨率显示器游戏的需求,那唯有GTX1060独显才能达标。而微星GL63和戴尔G7,就是现阶段最热的GTX1060游戏本代表,那么它们之间谁更适合你?看似并不对等的对决  微星GL63和戴尔G7都是伴随英特尔H系列八代酷睿发布才问世的新品,从性
期刊
更便携的小米平板4  作為小米平板家族的“四代目”,小米平板4此次不再遵循4:3的显示比例,而是改用了16∶10比例的8英寸屏幕,同时也大幅压缩了两侧边框,将机身宽度控制到了120mm左右,从而获得了更好的单手持握手感(图1),342g的体重也显得更加轻盈。  在千元级Android平板阵营,能在便携性与之媲美且具备较强性能的新品代表有台电T8(联发科MT8176,1299元起)、联想小新平板(骁
期刊