论文部分内容阅读
随着人们生活水平的提高,计算机、网络以及各种摄像器材的普及,人们可以非常方便的获取多种多样的图像与视频素材。如何对这些素材进行有效的编辑与处理,并生成符合某种特定要求的新的数字内容就成为当前所迫切需要解决的问题。图像与视频的特效编辑技术就是在这种形势下所提出的一种图像与视频处理技术。作为图像与视频编辑的关键技术,数字抠像与无缝融合已经得到了广泛的关注,成为当前研究的热点。经过学者们的共同努力,理论成果日趋丰富,但是目前还存在一些未解决的问题,比如视频抠像中的前景目标预测精度不高,算法不能处理视频帧之间的剧烈光照变化,抠像结果不能较好的保持帧间连续性,以及无缝融合中颜色调整算法尚不能较好的保持颜色的空间与时间连续性等问题。本文针对当前图像/视频的抠像与无缝融合中所存在的上述问题进行了研究,在以下几个方面取得了一些创新性的研究成果:(1)提出了一种不透明度扩散算法,利用相邻帧之间的相关性信息进行前景目标预测,极大的提高了前景目标预测的精度;利用光照变化的局部平滑性提出了一种颜色恢复算法,并将其与不透明度扩散算法相结合,解决了剧烈的光照变化对前景目标预测带来的影响,提高了算法的鲁棒性。(2)提出了一种基于前景目标预测的视频抠像算法,采用基于最短垂直距离的方法生成更为精确的三分图,采用大尺度的核窗口对不透明度扩散算法进行改进,使得前后两帧之间的对应窗口内具有相似颜色的像素可以取得相近的不透明度值,从而保持抠像结果帧间连续性。(3)提出了一种基于双层图切分的颜色协调化算法和一种基于扩散的颜色协调化算法。前者包括区域级图切分算法和像素级图切分算法两层。可以保证属于同一个物体却不连通的具有相似色度的各个部分能够被正确的协调化,并保持协调化结果的颜色平滑性。后者加入了预协调化的概念,首先采用一种扩散机制对图像进行预协调化,再通过直方图变换将预协调化图像转换为协调化图像。算法不仅可以保持协调化结果颜色分布的空间一致性,而且可以尽可能保持图像色度分布的多样性。(4)提出了一种基于交互的图像颜色传递算法,弥补了颜色协调化算法不能改变图像的亮度与饱和度的不足。采用交互对图像进行分层并计算像素属于每个图层的概率,对每个图层中的像素分别进行颜色变换,最后根据像素属于每个图层的概率进行加权计算得出此像素的最终颜色。图像的分层与加权融合可以尽可能的保持颜色传递结果的空间一致性。大量的实验证明,本文所提出的算法在精度、鲁棒性方面与现有算法相比具有较大的优势,可以广泛的应用在图像与视频的相关编辑处理中。根据本文的研究成果,本文还搭建了一个简易的图像与视频抠像与融合编辑处理系统,可以实现前景目标提取与无缝融合等操作,一方面进一步验证了本文算法的有效性,另一方面也为本文算法走向应用作好了铺垫。