论文部分内容阅读
视频对象的提取是任何基于视频对象的操作如索引、访问等的最基本的步骤。本文提出了一种自动地在频域上提取目标轮廓、在时域上提取运动矢量并结合两者信息的对象提取方法。对三维运动模型、图像的小波变换和光流场的分析等,都作了较为深入的研究和探讨。第一章首先介绍了本论文的课题背景及目前多媒体发展的趋势,说明在图像序列中提取视频对象的必要性。接着简要地介绍了当前国内外研究方法及其各自的优缺点,最后提出自己的一套较好的在编解码应用的场合下提取视频对象的方法。第二章对本文适用的视频对象模型进行定义及相关说明,并简要介绍了系统的框图,整个算法从频域和时域这两条主线走,然后联合两者的信息提取最终的视频对象。第三章集中阐述在频域上提取视频对象信息的算法。先介绍图像小波分解方法的原理、Mallat快速算法、多尺度特性、3阶B-样条小波基函数的选取及其滤波器系数的推导等,然后根据小波变换结果计算梯度矢量矩阵,进行非极大值抑制和双阈值化,提取目标轮廓。最后用与经典的canny边缘检测方法进行比较。在第四章中详细介绍了在时域上提取视频对象运动信息的方法。首先构建三维刚体运动的模型,提出一种计算模型的全局运动矢量的方法,并进行全局运动补偿、变化检测模板提取和连通域标记等步骤,然后引入光流场的概念,并介绍其计算原理和方法,用Horn-Schunck迭代法计算图像中各点的局部运动矢量,并据此对变化检测模板的结果进一步提取,获得时域上分割的信息。第五章在前两章的基础上,提出一种邻域相似程度的判据来联合频域、时域分割结果提取对象轮廓,最后进行区域生长、数学形态学算子滤波等后期处理获得最终的视频对象。第六章用多种标准图像序列测试本文所提出的算法并作相应评价。最后一章第七章进行全文总结,并提出改进的方向。