论文部分内容阅读
初识抽帧摄影
抽帧摄影非常依赖高品质的视频素材。不过,随着近年来大众消费电子产品的发展,能够拍摄高品质视频的摄影摄像器材选择非常多,抽帧摄影已完全具备大众化特点了。
如今,专业影视创作者大多使用专业摄录设备以及高品质电影镜头拍摄高清视频,比如RED HELIUM 8K、BMPCC 6K、ZCAM E2、Sigma FP等。这些器材的特点是价格极其昂贵、一个人没办法去操作、定位于专业影视创作团队。还有一些专业摄影师会选择采用单反相机、微单相机,或者中大画幅相机+数码后背,通过逐帧RAW格式拍摄延时摄影视频,普通消费者仍然难以承受,学习成本也非常高。
那有没有一些价格亲民,同时还能拍摄高品质视频的器材呢?目前市面上有三款相机价格都在5000元以内,主打视频拍摄,还能够兼顾影像质量和相机尺寸,分别是松下无反相机GH/4(GH5性能更强,但价格更高)、Kandao Qoocam8K全景相机和GoPro HERO 8 BLACK运动相机。其中,松下GH4可以机内录制4K10bit/422视频,QooCa m 8K可以机内录制8K 30fps 10bit 420全景视频,而GoPro HERO 8 BLACK可以利用其零延时快门机制,录制时长为3秒、每秒30帧的12bitRAW格式4K视频。使用拥有记录10bit视频能力的器材就能实现高品质抽帧摄影,虽然GoPro HERO 8 BLACK并不能记录10bit视频,但3秒12bit RAW格式记录能力也让抓拍瞬间变得易如反掌。
8bit/10bit视频都是指一种视频编码的特征。10bit视频指每个颜色通道用10个bit来表达。这样,每个颜色通道的色彩级数从8bit的256级提高到了1024级,颜色更加细致,渐变更加细腻。在8bit编码下,一些渐变色块由于色彩变化范围很小而面积很大,容易导致一端到另一端总共只出现了很少几种颜色的情况,使画面出现了BANDING现象(掉阶)。10bit颜色的颜色级数是8 bit的4倍,掉阶现象就很少发生,后期调色的空间也就更大。
不过,10bit视频并不是没有缺点。首先,计算机系统处理数据的单位典型是8bit,使用10bit可能会浪费一部分硬件数据传输和处理能力,使得处理性能低于8bit编码。其次,很多硬件和软件尚没有提供对其较好的支持,使得应用起来往往存在播放困难、消耗太多资源等问题。但随着视频编解码技术的发展,这些问题均已得到改善。
实现视频抽帧的基本原理
RGB色彩模式的数码照片以红绿蓝三种颜色的采样信息进行存储和展示,在8bit照片里,每一个像素点都包含78bit红、8bit绿、8bit蓝三种颜色共计2&bit采样信息。同样的道理,如果是10bit RGB照片,总信息数量就是30bit。该采样方式符合人类认知习惯,但把它用在视频信息记录时就显得不那么合适了,因为数据量太大。
视觉专家很早以前就知道,人眼对亮度分辨率的敏感度高于对色彩分辨率的敏感度。因此,视频信号会被分解为亮度和色度两个组成色彩的元素,这类似于图像分解为红、绿、蓝三个元素。亮度和色度元素被称为YUV(模拟信号)或YCbCr(数字信号)而不是RGB。一旦被分开,色度分辨率会通过一个叫做“色度取样”的步骤被减半或更多,结果就是在同样的广播带宽情况下,视频信号能呈现更多的细节(这是因为亮度元素对视频信号的贡献更大)。
我们经常会看到4:4:4、4:2:2、4:2:0这样的字眼,比如佳能EOS 5D Mark Ⅱ拍摄的视频是4:2:0取样压缩的,专业摄影机拍摄时是以4:4:4取样的。8bit YUV/4:4:4的采样等同于8bit的RGB采样。但是人眼对亮度信息更敏感,对色度信息不那么敏感,因此如果采用10bit YUV420的采样方式进行视频存储,不仅能保全了所有亮度信息,还拥有10bit位深度,同时还尽可能缩小原始数据量,再配合H.264或者HEVC等先进的视频编码手段,就形成了很多相机机内的10bit视频拍摄能力。
更进一步,视频编码当中都包含帧内编码(1帧)和帧间编码(P帧/B帧)。I帧通过帧内编码记录下的是一个完整画面,而帧间编码只会记录帧之间画面的运动变化,也被称为差别帧。因此,如果我们能够提取到I帧,则意味着我们在10bit视频画面中得到了一张能够媲美10 bit RAW格式的照片。这个画面的品质是如此之高,以至于我们可以把它当作RAW格式进行调色和创作。
抽幀摄影的实现步骤
上文中我们提到松下GH4(能够录制4K 10bit 422视频)和QooCam 8K(能够录制8K 10bit/420视频)。通过相机机身设置,确保按下拍摄按键之后,相机可以按照最高画质进行视频录制。
相机设置完成之后,在我们旅行过程中,就可以放肆去拍。通过预览视频内容,找到一些精彩瞬间A、B、C、D。例如瞬间A发生的时间为1分09秒。
使用ffmpeg软件打开视频,在精彩瞬间处抽取出原始的I帧,存储为无损TIF格式(10bit色深)。如果要做10bit与8bit的对比,再用ffmpeg同步抽取一张JPG即为8bit的结果。
用Adobe Camera Raw或者Adobe Photoshop Lightroom进行调色,然后发布。这一步中,你也可以采用任何一种你所习惯的调色软件。
通过以上4步就完成了抽帧摄影的全部流程。这里我们也会给出一些实例。你会发现抽帧摄影流程非常简单,就是从视频里面抽取特定的画面,该画面具有10bit RAW的特性。通过进一步的摄影调色流程,我们就能把画质潜力及艺术表现力彻底发挥出来。因此,抽帧摄影是一种通过录制视频方式进行摄影创作的方式。
通过10bit RAW图片获取16bit RAW图片
在以上原理讨论和实践案例中,我们使用10bit视频通过抽帧的方式得到一张素质不错的摄影作品。是否还能在此基础上进一步提升画质呢?实际上,我们可以通过计算摄影的思路来达到这样的目标,通过10bit RAW格式图片文件获取16bit RAW格式图片。
从数学原理上说,这样需要提升6个bit,即需要64张图片进行堆栈平滑得到最终图片。对于一个8K 30fps的视频,64张图片意味着需要拍摄2秒视频。因此为了验证这一想法是否成立,我采用ffmpeg和Python撰写了连续抽帧程序,并在Photoshop中撰写了自定义深度平均值堆栈的脚本。
最终,我使用一段ISO 800状态下在傍晚录制的8K 30fps 10bit视频,通过处理后得到了下面的试验结果。通过视频抽帧的方式,最终图片的画质被进一步增强了。其原理是:视频是以30fps的速率进行记录的,意味着我们拥有了30张/秒的10bit画面连拍,当找到最佳瞬间,并在其前后多抽取一些画面,通过堆栈的方式进行降噪,从而就得到了更加极致的画面。
在8K视频即将全民普及的时代,通过视频抽帧的方式进行创作必将成为一种新风尚。同时,它也是计算摄影的一种表现形式。这大概意味着,摄影与摄像界限逐渐变得模糊,摄影可以借助摄像的技术更进一步,摄像也因为摄影的发展更加绚丽多彩!