论文部分内容阅读
当今社会,经济和科学技术飞速发展,交通运输、金融银行、仓库管理、电力供应以及军事安全等部门对安全防范的需求与日俱增,要求不断提高,进一步促进了视频监控技术的快速发展,但是同时也出现了“视觉信息膨胀”的现象。 当前大部分视频监控系统的工作模式依然是需要工作人员不间断地监视分析场景内的活动,日夜值守,工作量繁重。同时,视频数据具有存储量大的特点,这一特点,一方面给视频存储设备带来了压力,有的视频监控系统由于存储空间问题,每隔3个月或者4个月即覆盖之前的视频;另一方面,大量的视频数据给事后回看监控视频和查找可疑运动对象、感兴趣的运动对象带来了极大的困扰,因为用户需要逐帧查看视频并从中寻找到自己感兴趣的运动对象。然而,权威数据显示,人的注意力仅能坚持20分钟,20分钟后90%以上的信息会丢失。因此,如何简洁有效地表达视频数据,方便事后回看和检索是视频研究的一个重点工作。 本文研究基于对象的视频摘要技术,提取视频中运动对象的信息,生成视频摘要,并构建了一个交互界面,使用户能够便捷地回看和检索感兴趣的运动对象。本文的工作主要包含以下几个方面: (1)总结视频摘要技术的常用方法,重点介绍基于关键帧的静态视频摘要技术和基于对象的动态视频摘要技术。 (2)提出新的运动对象跟踪算法,在SURF特征跟踪算法和Camshift跟踪算法的基础上,提出基于SURF和Camshift的运动对象跟踪算法,并将该算法应用于本文设计的视频摘要系统中。 (3)在视频摘要背景视频建立,提出根据运动对象检测结果来确定视频帧是否包含运动对象,从而选择丢弃或者保留该视频帧,并结合包含运动对象的视频帧和不包含运动对象的视频帧进行背景建模,得到的背景图像组成视频摘要的背景。 (4)阐述本文提出的结合阈值控制的视频摘要生成方法,并给出在视频摘要中运动对象的检索方法,最后设计并实现基于本文提出的算法的视频摘要系统。