论文部分内容阅读
随着计算机、通信和多媒体技术的不断发展,视频信息快速增长,如何对视频数据进行有效地组织、管理、表达和检索成为视频检索研究领域里的热点问题,本文主要利用计算智能与小波的相关理论对基于内容视频检索技术中的视频镜头边界检测和分层组织技术进行了较为深入的研究。首先讨论了视频镜头边界检测的特征提取,在研究分析了镜头切变检测的一般方法后,提出了基于支撑矢量机的镜头切变检测方法。该方法利用支撑矢量机良好的学习推广能力和镜头切变的特点,构造支撑矢量机分类器,实现对镜头切变的检测。该方法减少了经验阈值的数目和由此带来的人为因素的影响。仿真实验对具有不同特点的视频片段进行测试均取得了较好的结果,通过与其他方法检测结果的比较,证明了本文方法的有效性。其次,将视频的多帧差序列视为一维信号,提出了一种基于小波去噪的二次帧差滑动窗口镜头边界检测算法。该方法能同时检测出镜头的切变和渐变,仿真实验表明该方法在一定程度上克服了由于摄像机不规则运动、光影变化,画面中物体快速运动等造成的影响,通过对不同视频片段的测试和比较,表明本文提出的算法能较好地实现镜头的突变和渐变检测。最后,通过分析视频分层组织方案的基本思想,提出了利用基于免疫克隆的聚类算法对视频镜头进行聚类,实现基于镜头的视频场景构造,仿真实验表明该聚类算法对视频场景的聚类具有较好的性能,在此基础上可以实现视频的一种分层组织结构,为进一步的视频分析处理创造条件。