层次化视频语义标注与检索

被引量 : 0次 | 上传用户：lvxubin

【摘要】

：

随着多媒体、计算机和网络的发展,视频数据飞速增长。为了对这些海量视频数据进行存储、管理、和索引,需要研究高效的基于内容的方法对视频数据进行检索,而视频标注是视频索

【作者】

：

袁勋

【发表日期】

：

2008年期

【关键词】

：

基于内容的视频检索视频标注视频类型分类多实例学习特征选择半监督学习主动学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着多媒体、计算机和网络的发展,视频数据飞速增长。为了对这些海量视频数据进行存储、管理、和索引,需要研究高效的基于内容的方法对视频数据进行检索,而视频标注是视频索引和视频搜索的基础。本文研究如何利用机器学习和视频的特征,对视频进行多层次的、基于内容的标注。视频在结构上共分四个层次:视频(video)、场景(scene)、镜头(shot)、图象帧(frame)。通常视频标注主要在其中的视频层和镜头层中进行。视频层的标注是对整段视频标注其类型属性。镜头层的标注主要是依据从该镜头中提取的关键帧,标注其对应的语义概念。根据所标注的语义概念对应的是图象帧层次还是物体层次的,镜头层标注又可进一步分为图象帧层标注和物体层标注。本文研究在视频层、图象帧层、和物体层上进行视频标注时的关键问题,主要工作和创新之处归纳为以下几点:1.目前视频类型层标注的研究工作通常仅仅标注了几种简单的类型,或者是局限在电影、体育运动等某个特定的类型内标注其子类型,而且使用的分类器也过于简单。本文定义了一个相对完备的视频类型分层表示,分析并提取一系列与类型相关的时空域特征,并提出使用局部和全局优化的多类SVM二叉树提高分类精度。实验结果表明,本文提出的局部和全局优化的SVM二叉树与另外两种典型的SVM多类分类算法、以及现有的视频分类工作中使用的分类器相比,能够获得更高的精确度。2.当前的视频类型层标注工作都是采用被动监督学习的方法,需要大量的训练数据和费时费力的手工标注。本文将主动学习引入视频类型层标注,并提出使用后验概率来计算分类器对未标注样本的置信度,然后依据此置信度选择分类器最不确定的样本,也即最“有用”的样本提供给用户进行标注,从而用更少的训练样本获得和大量训练样本近似的分类效果,减轻用户标注训练数据的负担。实验结果表明,本文提出的基于后验概率的主动学习样本选择策略要略好于现有的基于变型空间的主动学习样本选择策略、以及被动学习的样本选择策略。3.对于图象帧层视频标注,本文考虑一种经常遇到的实际应用:仅拥有一小部分相关的正例,如何学习该目标概念的模型。此时进行视频标注主要存在下面两个问题:第一,对于仅有正例的训练数据,传统的区分型分类器如SVM等无法直接使用;第二,区分各种语义概念的底层特征有很大的不同,使用统一的特征无法适应各种语义概念的变化。本文提出一个基于流形排序的关键帧图象层视频标注框。对第一个问题,用流行排序解决仅有正例的不足,同时可以利用未标注数据的分布信息。对第二个问题,定义一个特征选择准则,引入特征选择为不同的语义概念选择不同的特征。此关键帧图象层视频标注框架支持新定义的目标概念和新特征的引入。4.在物体层视频标注中,传统的多实例学习表达忽略了各种语义概念之间的语义相关性。因此本文提出existence-based多实例表达来描述这种概念间的语义相关性,并根据existence-based表达设计一种新的多实例学习算法MI-AdaBoost。算法首先对训练数据中的每个包进行特征映射,转换成包级特征空间的一个特征矢量,从而将多实例学习转换为传统的监督学习。这种特征映射会为每个包建立一个包含大量噪声的高维特征矢量,可以用AdaBoost进行特征选择并构建分类器。5.不同的语义概念对应的底层特征有很大的不同,因此特征选择对视频标注是非常关键的一个问题。以前的研究工作在将多实例学习应用于视频标注时,都忽略了如何在多实例学习情况下做特征选择的问题。由于传统的单实例学习下的特征选择算法通常都无法在多实例学习中直接应用,本文提出了一种多实例学习下的特征选择算法EBMIL,能够在选择映射后的包级特征的同时,选择不同的特征源(颜色、纹理等),从而获得更好的视频标注效果。

其他文献

关于通信开关电源设备的应急处理预备方案

为了应对突发事件,针对各种原因导致的电源设备故障,文章结合实际维护和案例处理的经验,总结出应急处理的一些措施。按此处理,可以确保设备的正常运行。

期刊

通信开关电源设备应急处理预备方案

语录体与宋代诗学

在宋代社会文化环境的影响下,语录体作为一种古老的散文文体,不仅焕发了新的活力,同时也对宋代诗学的发展做出了积极的贡献。语录体在宋代的流行,促成了"诗话"这一诗学批评形

期刊

语录体宋代诗学诗话笔记禅门语录道学语录

福宝古镇旅游与环境生态安全的耦合

小城镇以其优美的环境、原始的风貌、浓厚的乡土气息和保存完好的历史遗迹,深深地吸引了许多旅游爱好者。开发小城镇旅游资源,可以促进当地经济、社会和文化的发展。然而,一

学位

福宝古镇旅游环境生态安全耦合

贺麟先生知行关系论的创见

贺麟先生在20世纪三四十年代构建了一个独具特色的知行关系论体系,这是中国传统知行论的合乎逻辑的发展,又是批判吸取西方认识论的产物。贺麟先生不仅对知、行、合一的内涵有

期刊

贺麟认识论知行创见

英国初任教师入职培训政策探析

教师的入职教育是职前教育与职后教育的纽带,对教师整个职业生涯的专业发展都起着重要作用。因此,有必要在教师入职期为其制定法定的入职培训政策,以促进教师入职教育的顺利

学位

英国初任教师入职培训政策

农地流转中的农民土地权益流失

随着市场经济的深入发展,各地围绕土地问题而产生的矛盾日益尖锐,关于农地流转方面的纠纷就是其中非常典型的一种。关于农地流转,国内学者大多关注农地流转的效率、土地规模

学位

农地流转土地权益流失产权

基于多传感器校正的液压支架支护状态监控系统的分析

通过对液压支架姿态监控系统现状的研究,提出了一种新的基于多传感器校正的液压支架姿态监控系统。对该监控系统的整体结构布局、多传感器融合校正方案等进行了分析,分析认为

期刊

传感器校正液压支架姿态监控

我国大学校训的整体特征与优化完善——以“211工程”大学校训为样本的分析

大学校训是大学师生共同遵守的基本行为准则与道德规范,是大学文化精神的核心体现。好的校训能集中反映一所大学的办学宗旨和历史传统,体现出学校的文化追求和精神风貌。我国

期刊

大学校训整体特征优化完善文化根基

幼儿同伴冲突中教师教育行为研究

孩子之间的冲突十分频繁,这是他们学习同伴交往的一个自然历程。处理好孩子们这些看似细小、微不足道的冲突是教师日常工作的重要组成部分,教师教育行为是否恰当会直接影响到

学位

幼儿同伴冲突幼儿教师教育行为

影像学检查在原发性肝癌TACE术后疗效评价中的应用价值及进展

原发性肝癌（PLC,简称肝癌）是世界上最常见的恶性肿瘤之一,占全部肿瘤的5%以上,全球发病率逐年增长,在我国也是高发,目前,我国发病人数约占全球的55%;在肿瘤相关死亡中仅次于肺

期刊

原发性肝癌肝动脉化疗栓塞术影像学

层次化视频语义标注与检索

其他学术论文