论文部分内容阅读
随着计算机网络和多媒体技术的快速发展,快速有效地进行海量视频数据检索已成为一个亟需解决的问题。视频数据库索引的建立是视频检索的重要基础,基于视频内容分析的自动视频标注是建立高性能视频索引的有效方法。针对跨域视频数据标注问题,重点讨论机器学习理论此特定背景下的扩展和应用,以及与视频标注相关的技术研究与改进。通过深入研究现有的基于内容视频标注的理论和方法,提出基于自适应帧差和背景减除的运动目标检测、基于MeanShift聚类的关键帧提取以及基于自适应SVM的半监督主动学习视频标注,并设计实现视频标注原型系统。主要研究工作如下:
(1)提出一种基于自适应帧差和背景减除的运动目标检测方法。首先引入经典帧差法,将其改成能自动选择二帧差或三帧差的自适应帧差法,然后与背景减除法结合分别对当前视频帧图像进行帧间差分和背景减除运算,将分别获取的二值化模板进行逻辑“或”运算得到中间背景模板,按照一定的模型更新背景,最后对背景模板进行后续处理并分割运动目标区域。
(2)提出基于MeanShift聚类的关键帧提取方法。首先提取视频序列运动目标并计算其Zemike不变矩,将运动目标的Zernike不变矩作为MeanShift聚类算法的特征数据,MeanShift聚类算法根据特征数据的相似程度对视频帧进行聚类,最后选择离聚类中心最近的帧作为关键帧。该方法提取的关键帧能更好地表示镜头内容且关键帧集合不存在冗余。
(3)提出一种基于自适应SVM的半监督主动学习视频标注方法。首先引入Delta函数和优化模型参数将现有分类器转换为自适应支持向量机分类器,然后将基于高斯场和调和函数的半监督学习融合于基于自适应支持向量机的主动学习中得出视频数据的相关性评价函数,最后根据评价函数对视频数据进行语义标注。该方法能更好地解决具有不同分布特性的视频包含相同语义概念时表现出不同视觉特征导致标注正确率下降的问题。
(4)采用面向对象思想设计并开发基于自适应SVM的半监督主动学习视频标注系统。该系统包括运动目标检测、关键帧提取、视频标注等功能模块,通过相关实验对比验证所提方法的有效性。