论文部分内容阅读
抠图是从整幅图像中提取感兴趣部分的一种技术,在影视制作、图像处理和虚拟现实等领域都有着非常广泛的应用。如何准确提取图像或者视频中感兴趣的部分一直是抠图领域研究的重点和难点。自然图像抠图对图像的背景没有限制,能取得较好的抠图效果,所以越来越受到人们的关注。早期的自然图像抠图算法需要人工标定复杂的三分图,运行速度很慢。近年来出现的一些自然图像抠图算法在一定程度上减少了人工交互量,但很难处理复杂的图像。本文中,我们以提高抠图的效果和效率为目标,改进现有的抠图算法,并尝试将改进的抠图算法运用到视频抠图中。视频抠图是把视频中每一帧中感兴趣部分提取出来,如果单独对每一帧抠图,即先人工标记每一帧再对其抠图,则需要消耗大量的人工交互时间,且由于没有用到视频的帧间相关性,很难保证视频抠图结果的时空一致性。本文中,我们重点探讨利用帧间相关性提高视频抠图效果的方法,期望既能减少视频抠图时间,又能保证视频抠图的时空一致性。本文的主要工作如下:1.研究图像的鲁棒抠图算法。利用自适应窗口技巧,设计一种减少需要计算掩膜值的未知像素点数的方法。首先计算未知区域内一个像素点的掩膜估计值和与之相对应的最优前背景样本对及其信度。根据图像的局部平滑性,可以认为该像素点邻域内像素点也对应着该最优样本对,这样就可以大大减少需要计算掩膜估计值的未知像素点个数,从而提高抠图效率;传统鲁棒抠图算法在求未知像素点掩膜值过程中,只考虑了距离比率和距离权重两个因子,改进算法充分考虑灰度信息对掩膜值估算精度的影响,在原有鲁棒抠图算法的的基础上增加一个灰度权值。实验表明,改进的算法既保证较高的抠图质量,又缩短抠图的时间。2.研究视频关键帧的求取算法。提出结合运动场能量和二分法求取视频关键帧的方法。该方法利用二分法将视频分段,通过比较中间帧与关键帧的运动场能量的大小来判断中间帧是否为关键帧。实验表明,该方法能大大减少关键帧的求取时间,得到的关键帧也能较好地代表整段视频的内容。3.对关键帧的三分图传递进行分析和研究。获取视频的关键帧并得到三分图后,利用视频帧间相关性将关键帧的三分图传递给后续帧。本文中,我们采用一种基于灰度信息的三分图传递策略,通过比较相邻帧相同位置像素点的灰度值间的差异,判断像索点属于三分图的哪个区域,实现三分图向后续帧的传递。实验结果表明,此方法能达到效果和效率上较好的平衡。