论文部分内容阅读
运动分割与运动估计是图像处理和计算机视觉的两个基础问题,有着广阔的应用前景。本论文研究了基于2D/3D视频的运动分析,提供一种结合活动轮廓演变和运动参数估计的变分模型,致力于求解摄像机运动、多目标等复杂环境中的运动分割和运动估计等问题的鲁棒性解。全文的主要工作和创新性概括如下:●针对2D/3D视频的运动分析,提出了一种在多目标、摄像机运动等复杂情况下能够同时进行运动分割和运动估计的统一框架。首先,通过统一框架将分割与估计融合在同一能量函数中,因此该模型能够同时进行分割曲面的演化和运动参数的估计。由于目标函数建立在时空域上,运动目标的边界在时空域的轨迹就形成一个曲面,可以同时实现运动目标的跟踪。另外,将运动目标分割和运动参数的估算结合在一起,能有效的利用空间和时域信息,可以更好施加三维运动约束。其次,该方法允许摄像机运动,且能够在不需要任何摄像机运动先验信息的前提下对前景进行自动分割。最后,本文方法对目标数目没有限制,也就是说任何和背景运动不一致的目标都可以被检测。●针对基于水平集方法的时空域分割模型在求解过程中存在的计算效率较低,对初始化位置敏感等问题,我们提出了一种基于全变分的新模型,并给出了基于活动轮廓的时空域运动分割模型与基于全变分的分割模型之间的密切关系。通过凸化方法将原能量泛函转变为对分割变量凸的目标函数,该模型破除了非凸的“诅咒”,由于目标函数对分割变量是凸的,所以分割的结果不再依赖初始化条件,当其它变量固定时,任何优化方法都能够保证对分割变量的全局最优解。同时,由于该模型是一个连续性的模型,因此相比于离散算法如Graph-Cuts,拥有更加快速和精确的解。●凸化后的时空域分割模型的求解难点在于全变分项的非线性和不可微性,导致能量泛函的最小化过程在数值求解时存在一定的瓶颈。针对全变分模型的传统求解方法中的缺点和不足,我们提出了两种快速有效的算法——原始-对偶算法和Split-Bregman算法。●针对运动分割和稠密3D表达,提出了一种新的基于单目图像序列的运动分割和稠密3D表达的凸模型。首先,寻找运动参数与深度的约束关系,利用Bayes建模得到能量泛函;其次,由于基于活动轮廓的模型本身的非凸性,使得能量泛函最小化过程中存在着陷入局部最小值的可能,所以采用凸松弛方法对能量泛函进行凸化;最后,能量泛函的最小化过程利用多变量交替迭代的方式,在变量初始化以后,分别进行运动参数的估计、深度的估计和曲面的演化。