论文部分内容阅读
随着多媒体技术和计算机网络技术的发展,人们接触到的视频数据容量以前所未有的速度增长,面对海量的视频信息,研究有效分析、组织和管理视频数据的基于内容的视频检索系统日益成为多媒体技术的研究热点。 基于内容的视频结构化分析是视频检索系统中的一项重要内容。视频结构化分析的目的是通过对视频数据从低层到高层的处理、分析和理解,建立视频数据的语义结构,进而实现对视频内容有效的组织。论文针对视频内容结构化中的相关技术进行了系统的研究,提出了有效的算法,并用实验验证了这些算法的有效性。 在特征提取问题上,论文提出了一种摄像机运动的层次分类方法。该方法利用支持向量机在有限样本条件下的学习能力,充分考虑运动矢量的方向和分布的统计特征,实现了摄像机平移、缩放和旋转运动类型的分类。论文还将摄像机运动特征应用于语义场景的识别和视频摘要的生成。 在镜头边界检测问题上,论文提出了一种层次化的视频镜头边界检测方法。该方法利用小波变换对奇异点检测的有效性和鲁棒性,实现了镜头边界的预检测,并通过对候选镜头边界区间内视频序列的边缘和运动特征的分析,有效地降低了闪光灯和快速运动噪声的影响。在渐变检测中,实现了淡入淡出、扫换和叠化等3种镜头边界类型的检测。 在语义场景检测问题上,论文系统地分析了电影语法在场景制作中的作用,提出了一种基于电影语法的语义场景检测方法。电影语法的融入,保证了场景分割的合理性,有效地减少了过分割。论文利用电影节奏实现了语义场景中动作场景类型的检测,并实现了其中两种重要动作场景(打斗和追逐场景)的识别。 最后,在视频摘要问题上,论文提出了一种基于视频结构和语义重要度的视频摘要生成方法。该方法同时考虑了用户对视频内容完整性和语义重要度的要求,并根据用户选择的偏好系数,建立了多级混合视频摘要。实验结果表明该视频摘要取得了较好的用户满意度。