论文部分内容阅读
“肖像模式”是当下主流智能手机的主要功能,该模式使任何人都可以拍摄具有比肩大光圈镜头+单反相机的浅景深图像。而著名的相机打分机构DxO Mark更是有单独为肖像模式打分的选项。手机的传感器非常小,镜头的焦距也很短,按照一般的物理规律很难拍到浅景深的画面。然而为什么在手机上却出现并且还成为了一个重要的卖点呢?作为计算摄影术之中最具有代表性的玩法,我们首先讨论该功能背后蕴藏的故事。
具有大光圈的单镜头反光式相机的景深较浅,这意味着特定景深范围内的物体很清晰,而位于景深之前或之后的物体则发生模糊,并且这种模糊与物体距相机的距离还遵循一定的数学关系。浅景深是吸引观看者注意对象或抑制背景混乱的好方法,同时浅景深使得使用单反相机拍摄的肖像具有独特的艺术魅力。
浅景深图像中的模糊量取决于物距。物体离对焦平面越远,它们就会显得越模糊。模糊程度还取决于镜头通光孔径的大小。具有F2.0光圈的50毫米镜头的开口直径为50毫米/2=25毫米。使用这样的定焦镜头,即使距离对焦平面只有几英寸的物体也会显得柔和。
浅景深图像肖像照片的另一个迷人之处是光线模糊点所呈现的形状——散景,它取决于镜头光圈的物理结构,尤其是点光源弥散形成的光斑,因为光圈的原因而变的更加迷人。
与单反相机不同,手机相机通常情况下都只具有固定的小尺寸光圈,画面当中几乎所有物体都在清晰景深范围以内。但是,如果我们知道从手机相机到场景中各个点的距离,则可以用经过模糊算法处理后的像素替换图片中的每个像素,就能得到浅景深的图片。其模糊的数量取决于该场景点与焦点对准平面的距离。我们还可以通过算法进一步控制这种模糊的形状从而达到控制散景的目的。
那么在计算摄影中,手机如何估计到场景中每个点的距离呢?最常见的方法是多个摄像头方案,其中以双摄像头手机最为常见。双摄像头系统中,对于左侧(上方)摄像头图像中的每个色块,我们在右侧(下方)摄像头图像中寻找匹配的色块。在两个图像中找到此匹配项的位置,便可以通过三角测量推算出场景的距离数据。其工作原理几乎与我们的眼睛观看物体时一模一样。
不过,很多单摄像头智能手机也可以达到类似的效果,又是为什么呢?这是通过将图像分为两层——前景中的像素和背景中的像素,从而实现模糊背景。只不过单摄像头这样的处理是一种缺失深度信息的模糊,无法控制远近物体模糊的程度。通过查阅公开的技术资料,我们能够了解到,在GooglePixel手机中,便采用了机器学习的方法实现了浅景深肖像模式。其主要思路便是基于机器学习的前景背景分割,从而确定哪些像素属于前景(通常是人),哪些像素属于背景。谷歌的计算摄影工程师通过TensorFlow(其是一个基于数据流编程的符号数序系统,被广泛应用于各类机器学习算法——编者注)训练了特殊的神经网络,除了依赖深度学习,还可以通过手机传感器的相位对焦(PDFA)技术进一步改善背景虚化的效果。
以上原理或许不能马上理解,但是我们可以在此基础上了解到想要把手机的“肖像模式”拍摄运动得当,有以下几个小技巧可以帮助摄影者权衡取舍后获得最佳的肖像拍摄效果:
1.站立得离被摄主体足够近,以使其头部(或头和肩膀)充满整个取景框;
2.对于希望所有人都能够拍摄清晰锐利的集体照,被摄对象应尽量站在距离手机相同的位置上;
3.要获得更令人满意的模糊效果,请在主体和背景之间留一些距离。
4.必要时应当摘下墨镜等配饰以便与算法完成精准的语义分割(即分离前景和背景像素)。
最后需要说明的是,具有多个摄像头的手机在肖像模式下,会事先记录下了多个摄像头的拍摄数据,因此可以在拍完照片后任意地调整“焦点”的位置,从而达到先拍照后对焦的效果。有兴趣的读者可以结合自己的手机去尝试下。更有意思的是,摄影者不仅可以调整影像清晰的范围,还可以通过算法模拟物理光圈大小,从而达到调整散景虚化程度的效果。总之,肖像模式算法非常好地弥补了手机摄影先天存在的短板,甚至能达到相机达不到的惊喜效果。