基于RVM的视频内容分析研究与实现

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:y58jm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体信息技术和网络的飞速发展,基于内容的视频检索(CBVR)已成为当前视频研究的热点课题之一。而视频内容分析技术是实现CBVR的技术基础,其中镜头边界检测和视频语义提取都是视频内容分析研究中的核心技术。由于视频数据量巨大、编辑效果多样以及存在多种干扰,很难提出一种通用性和检测性能俱佳的算法,因此镜头边界检测具有很大的研究价值。同时低层特征和高层语义之间存在语义鸿沟,使得用语义概念来描述和操作视频的内容变得非常困难。如何提取视频语义信息,跨越语义鸿沟成为当前非常具有挑战性的研究方向。   针对上述视频内容分析中的问题,本文结合相关向量机和图分割模型各自的优势,将两者应用在镜头边界检测和视频语义提取的算法中,以提高视频内容分析的性能。本文的主要创新内容如下:   1.深入研究了视频内容分析的关键技术--镜头边界检测和视频语义提取,综述了目前已有的算法,并且从不同角度分析了它们的优势和不足。基于此,提出了基于RVM的视频分析系统框架并且已经成功实现。该框架可以高效地进行视频内容的分析和相关的研究工作。   2.提出了基于RVM的视频边界检测算法。在算法中,采用了多对帧间比较的方法,并且训练时使用RVM代替传统的SVM,以提高分类器性能。本文实验以TRECVID2005视频数据为素材,实验结果表明:本文算法已经解决了闪光造成的影响以及阈值设置问题,而且在进行边界检测时,不但准确率有显著提高,而且比基于SVM的算法更加高效。   3.提出了融合主动学习和RVM的视频关键帧语义提取算法。该算法在结合HSV直方图、MPEG-7边缘直方图和灰度共生矩阵多种底层特征的基础上,采用图分割模型对二叉树结构进行优化,进而构造最优二叉树多分类器,并且运用主动学习策略选择最佳样本加速RVM训练过程。实验结果表明:该算法提升了训练速度,同时训练的最优二叉树多分类模型能够更加准确地提取语义,而且速度加快了近17%。
其他文献
本论文课题来源于中山大学与IBM新技术研究院的联合研究项目“E-Campus2.0中的面向知识工作者的协同创新平台”。   随着信息时代的发展和社会分工的细化,人与人之间的合作
网络编码已被证明能够达到网络传输的容量极限,它能大大提高网络的吞吐量,降低延时,提高系统的鲁棒性和安全性。实际传输中,信号总是受到信道噪声和信道衰落的影响,而协作分集能有
科学计算可视化是20世纪80年代后期在计算机图形学基础之上发展起来的一门新学科,它融合了计算机图形学、计算机辅助设计以及人机交互等各面技术,在医学、气象学、天文学、地质
移动通信网络定位是通过技术手段来得到手机用户通话和空闲状态下的地理位置。本文研究的GSM网络定位的目的是为运营商提供整个网络运行状况的信息,为修改和调整系统参数提供
图像分割在图像学中是比较底层的技术,它为计算机视觉研究、深层次的图像分析打下基础。近年来,随着医疗领域的不断扩大和发展,各种各样的医疗设备也不断的出现,这为临床医学
视频目标的检测跟踪一直是计算机视觉领域研究的热点和难点之一,在智能交通、机器人、人机接口、武器制导、工业控制、医学治疗等方面得到了越来越丰富的应用。其目的是为了
Petri网是一种系统的数学、图形建模和分析工具。它特别适用于具有同步、并发、冲突的离散事件系统的建模,并被广泛应用于分布式并行处理、离散事件、柔性制造等复杂系统的设
机械制造业作为我国国民经济的重要支柱产业,在国家经济发展中占有重要的地位。随着我国经济全球化进程的不断推进,我国制造业面临着更加激烈的市场竟争,作为机械制造行业核心竟争力的机械设计技术和创新产品的开发技术,越来越受到企业的关注。随着计算机技术进一步发展和深入应用,一些新的现代设计理论和技术成为学术界和企业界关注和研究的热点。计算机支持的协同设计技术作为产品现代设计理论和技术的应用研究领域,已成为国
随着我国公路建设的发展,公路养护维修的多种任务也伴随而来,尤其是我国修建的一些高等级公路已进入中修或大修期。当前的三维检测技术已基本满足路面管理系统、智能交通系统
Web服务作为一种构建面向服务架构(SOA)的分布式计算技术,具有良好的互操作性、白描述性和模块化的特性,以其松散耦合、基于标准、高度可集成能力等优点成为当今工业界和和学