视频语义标注方法的研究和实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:jexwbx45535
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的发展,视频资料的数据量不断膨胀,为了有效地理解和利用视频中包含的丰富信息,不仅需要合理的数据库系统来组织丰富的视频资料,还需要行之有效的视频语义理解方法来为使用者提供最大的便利,因此,从20世纪90年代开始,视频语义标注技术逐渐成为研究的热点和难点问题。本文以视频多模态特征分析为基础,提出了一种基于分类的视频多模态特征融合方法,同时还分析比较了视频标注中小样本问题的三种半监督学习算法。本文的主要工作如下: ·提出了一种基于分类的视频多模态特征融合方法。 根据视频的多模态特性,本文研究了视频标注中的多模态特征融合问题,提出了一种基于分类的视频多模态特征融合方法。在每个单模态下训练的分类器用来计算镜头在该模态下包含概念的置信分数,不同模态下的分类器输出按照基于概念类的权重进行融合。权重通过采用基于概念类的方法来确定,从而制定多模态融合策略,类中包含的概念能够共享同一种权重融合策略,融合的权重是通过在训练数据集合上学习确定的。实验对比结果显示,基于分类的视频多模态特征融合方法取得了比现有算法更好的标注性能。目前,概念的类别是人工预先定义好的,如何自动地对概念进行分类是值得进一步研究和探索的课题。 ·分析比较了现有的三种视频标注的半监督学习方法。 基于目前收集和手工标注视频信息的困难,及视频语义标注的研究和应用价值,本文研究了如何运用半监督学习技术进行视频小样本标注的问题。由于存在少量的已标注样本和大量的未标注样本,如何利用未标注样本来提高原有标注方法性能成为该问题的重点。因此,我们采用半监督学习的技术,自动从未标注样本中挑选出新的样本数据,然后用这些数据充实原来的标注样本集合。在选取新样本的时候,充分考虑并利用视频的多模态特征,从而提高整体的标注性能。本文实现了现有的三种半监督学习方法,并进行了实验对比,对小样本标注的关键问题进行了实验对比和分析探索。
其他文献
包装纸盒的三维仿真是指根据包装纸盒的平面展开图数据,用软件模拟出纸盒的折叠过程和最终的三维成型效果,以供设计者检查盒型是否满足设计要求。这样可以及早地发现设计失误,同
空间数据挖掘的主要特征是分析空间关系,然而,某特定空间的属性总是联系的,且能由其邻接对象的属性来解释。相对于关系数据库里的挖掘,空间数据挖掘算法为了提取有用的知识,需要考
据中国互联网络信息中心统计,截止2014年6月底,手机网民规模首次超越传统PC网民规模。Android开源操作系统凭借其充分的开放性,取得了飞速发展,市场占有率遥遥领先于iOS等其他移
边缘是图像最基本的特征,因而边缘检测是图像处理中的重要内容。近十几年来,迅速发展起来的小波理论为图像处理带来了新的理论和方法,由于小波变换的良好局部特性与多尺度特
在工业、社会、经济和管理等众多领域中,人们面临着大量的最优化问题。用模拟生物界自然现象而发展起来的群智能优化算法来解决此类问题已被越来越多研究者所关注。PSO(Parti
本文在模糊推理插值器和真值递延法的研究基础上,探讨了“等价式形式系统”(用等价式代替传统蕴涵算子所得到的新的形式逻辑系统)的二值命题演算理论。按照传统命题逻辑形式系
随着经济的发展,新的收费道路的建设,公路网覆盖地区及经济辐射区域的扩大,给路网收费设计提出了新的要求。一个是收费位置的确定,如果不考虑各地实际的经济水平和交通流量的大小
形态分析作为一种重要的股票投资方法,已经得到了广泛的应用。技术形态是股价序列中反复出现的模式,这些模式中隐含着对预测将来股价有用的信息。 过去的股价形态如果用股票
目前,基于Web方式的B/S架构模式瘦客户端应用程序正被人们广泛关注,基于这一模式的应用程序系统也被得到大量的开发。B/S架构模式的应用程序以它集中部署、集中管理和集中维护
在信息化高速发展的今天,企业对于网站功能的需求正在不断加强。随着企业网站的规模急速膨胀,企业网站站内搜索的需求油然而生。在过去的实践经验中,基于数据库检索的站内搜索和