论文部分内容阅读
随着社会经济的不断发展、科学技术水平的不断提升,互联网上的数字视频正不受限制地增长并且逐渐成长为一种新型的力量。这些视频大多数存储在非结构化的存储库中,因而对图像和视频检索的研究和开发任务构成了巨大的挑战。由于视频本身包含有丰富信息的特点,导致采用人工标注视频内容属性信息的方法有很大的不足。基于当前这样的情况,如何让计算机自动提取视频的内容特征与视频检索技术已经成为目前亟待解决的课题。近几年来,随着基于内容的视频检索技术快速发展和人工智能技术的突破,越来越多的研究人员和学者投入到该领域的研究中来。视频检索领域中涉及到的核心技术主要有镜头分割、关键帧提取、视频匹配和视频检索,其中视频的镜头分割和关键帧提取技术成为了当前数字视频检索系统发展的关键步骤。本文详细研究了AP聚类算法(近邻传播聚类算法),并将基于AP聚类的优化算法应用到视频关键帧提取中,以此来提高数字图书馆视频检索系统中检索结果的准确率和效率。本文的主要研究内容及方法如下:(1)优化视频相邻帧间差计算方法。针对视频镜头分割步骤,传统的视频帧的颜色特征提取方法仅仅是对颜色值进行统计和整理,而没有考虑空间分布情况,为了使颜色特征更具有代表性,本文提出了一种基于视频帧内容的区域分块计算方法将空间信息与颜色特征进行了融合,并依据一个视频帧的不同位置的颜色提供的信息量各不相同为理论依据,对帧进行分块处理并分配不同的权重,自动调整各分块区域的重要性权值,从而提高了镜头边界检测算法的鲁棒性和普适性。(2)提出自适应镜头聚类算法提取关键帧。关键帧提取是视频检索中的重要环节,采用常见的聚类算法提取关键帧产生的漏检帧和冗余帧总是影响着关键帧提取结果的精确度和效率。为了尽量减少漏检帧和冗余帧带来的影响,本文在基于AP聚类算法上进行优化,具体方法是先依据每副帧所表达的信息不同,在算法的初始相关系数矩阵中增加权重,同时,一个视频帧的数量普遍较多,采用自适应方法调整阻尼系数来避免聚类算法收敛时候的震荡。通过实验结果验证,本文提出的方法有效地解决了提取关键帧方法中时间复杂度高和视觉信息低效的问题。(3)研究镜头动态聚类算法在数字图书馆的应用。结合重庆理工大学图书馆里面的数字视频栏目,对数字图书馆中的学习视频以及视频检索方案进行需求分析,提出了视频检索的设计目标和设计思路,建立数字图书馆视频数据库,进行视频检索实验,实验结果表明,改进的动态聚类算法在保证时间复杂度的情况下,提高了数字图书馆的视频检索效率。