论文部分内容阅读
随着通信和信息处理技术的发展,大量数字化的视频服务需求不断涌现,如:数字电视、远程会议、视频电话和交互式多媒体等。这些伴随着大数据量的应用和服务需要更先进的数字信号处理技术,以进行更高效的传输和存储。视频对象分割就是其中一种技术。
现有的基于时域和基于时空的视频对象分割技术,还不能对语义对象进行精确分割。而在立体视频序列中,可以获得接近于语义对象定义的深度(视差)信息,十分适合用来分割视频对象。
本文在对各种视差估计方法研究的基础上,提出一种基于边缘信息的二级立体匹配方法,根据对象边缘特征在匹配过程中选择适当尺寸的匹配窗口,并对匹配搜索过程进行优化。此外,针对视差估计过程中的遮挡问题,本文提出一种基于运动信息的遮挡补偿法,利用相邻帧之间对象运动与遮挡的关系对遮挡区域的视差进行补偿,最终得到较精确的视差场。该视差场是进行视频对象分割的重要中间信息。
通过视差场分割,可大致获得视频对象,但由于视差场分割结果一般在对象边界处不够精确,需要依靠时空分割结果进行修正。本文提出的变化检测算法在检测过程中根据已获得的视差场分割结果,在相邻帧中把对应于各个视差分割对象的区域单独进行运动变化检测。然后,再融合边缘检测对视差场分割结果进行修正。实验结果表明,上述算法得到较精确的视频对象。