数字视频信息的组织与索引研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:fencer_20
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子技术、网络技术和多媒体技术的发展,以及视频应用的日益普及,人们面对的视频信息量急剧增长,用户对视频信息的需求也不断提高,因此视频信息的分析、处理、组织、索引和检索等内容的研究具有很强的现实性和紧迫性。数字视频信息的组织与索引是视频信息检索和消费的基础。从研究现状来看,近年来主要是来自电子工程、计算机科学等学科的一些学者从技术角度对此做了大量的研究,包括镜头检测、关键帧提取、视听特征提取、图像理解和相似性度量等等,而从图书情报学角度来研究数字视频信息的组织、索引和检索的并不多。本文主要是从图书情报学视野来研究数字视频信息的组织与索引问题,包括数字视频信息的压缩编码、结构化分析与处理、元数据标准以及索引与检索等。  首先,本文在讨论视频信息的数字化、数字视频信息的特点、压缩编码标准和存档管理现状等内容的基础上,分析了目前视频信息压缩编码和存档管理中存在的问题,并提出了一些解决问题的想法。同时,在此基础上分析和归纳了视频应用的用户需求,以及数字视频信息组织与索引的主要研究内容。数字化是实现视频信息长效保存以及处理和操纵的重要基础,压缩编码是解决视频信息存储与传输的根本办法,而视频信息的组织与索引是实现有效且高效的检索与消费的重要保证。从数字视频信息的用户来看,可以粗分为消费型、研究型、创作型和应用型四种类型,他们对视频应用有着不同的需求,通过用户的需求分析可以为视频信息的分析、处理、组织、索引和检索确立出发点和目标。视频信息组织与索引的主要研究内容包括视频信息的数据化、压缩编码、结构化分析、数据模型、标注与索引,以及视频元数据标准等诸多内容。  本文考察和分析了视频结构化分析处理的主要内容,包括镜头检测、关键帧提取、场景分割、故事单元构建和视频摘要等。视频信息的结构化分析处理是一切基于内容的视频应用的基础和前提,它为视频信息组织与索引提供了基本对象。但受目前图像理解等人工智能技术的限制,以及视频信息编码、编辑和存档格式的限制,视频信息无明显的结构化信息,需要通过一定的方法和技术手段对其进行分析处理。相对来说,对于视频信息所蕴含的层次结构模型已有一致的共识。其中,镜头检测、场景检测和关键帧提取技术也已日见成熟,本文对此进行了全面的考察和分析,难点在于与人的主观认识有关的语义层次的故事单元构建和视频摘要生成。镜头检测和视频摘要在视频信息的浏览和检索中起着重要的作用,本文对此进行了重点研究。  分析和比较了现有的一些与视频相关或通过扩展可以借用的元数据标准,包括电视行业元数据标准(如DVB-SI、SMPTE、TV-Anytime、EBU Project P/Meta等)、软硬件开发商制定的元数据标准(如Apple公司的QuickTime、Microsoft公司的Windows Media等)、DublinCore元数据集和MPEG-7标准,在此基础上提出视频元数据框架应该是一个多维的结构,应从元数据功能、视频节目类型和面向的应用领域等角度来研究元数据标准和应用模型,并给出了一种通用视频元数据框架。元数据标准是信息资源描述的标准,也是实现信息资源共享与互操作性的基础。视频信息因其节目类型的多样性、应用的广泛性,以及在存储、传输和播放等过程中管理的复杂性,其元数据标准也具有多元性。目前,面向不同的应用或从不同的角度提出和制定了一些视频元数据相关标准,但这些元数据标准大多是面向专业人员或特定应用的。为了实现资源共享和提高互操作性,视频元数据标准和规范需要一个统一的多维的框架或模型,且这种框架或模型应以MPEG-7标准为核心,或与MPEG-7相适应。  本文从视频内容模型出发,从视频索引信息内容的分类角度提出了一种视频索引框架,并系统地对各种索引信息的生成方式和索引信息的编码表示方法进行了研究。视频索引包括基于外部信息(主要是编目信息)的索引和基于内容的索引。其中,基于内容的视频索引(特别是自动提取语义信息)是视频索引研究的难点和热点,也是实现基于内容的视频检索的关键。本文讨论了通过基于特定领域知识的语义模型和视频本体论研究实现视频高层语义索引的方法。  分析了数字视频信息应用所面临的挑战(如异构网络环境、设备能力、数字化版权等问题),考察了处于发展之中的MPEG-21标准,并在此基础上提出了一种基于MPEG系列标准的视频信息组织与检索系统框架。视频信息的组织应该建立在MPEG系列标准上,特别是充分应用MPEG-7与MPEG-21标准。虽然从其名称上看,MPEG-7和MPEG-21是针对多媒体信息描述与组织框架的标准,但其主要内容是针对视频信息的。  视频信息检索有多种不同的类型,但基于文本(关键字)的视频检索和视频浏览仍然是最实用、也是应用最广泛的检索手段。本文系统地讨论了各种视频检索手段和视频搜索引擎,并结合实例进行了分析。
其他文献
本文在阐述流域空间经济的整体性和关联性、区段性和差异性、层次性和网络性、开放性和耗散性等特征的基础上 ,分析了流域开发的系统性、综合性、分区性、立体网络性和以水资源开发为中心的原则。以区域增长和空间经济发展模式为指导 ,以点轴开发为流域开发的重要组织形式 ,提出了依托大中城市 ,强化中心 ,通过“点”的经济技术力量向两翼腹地的辐射和扩散 ,又通过轴作用的向外 (上、下游 )传递 ,如此形成一种由点
从制造业大国到制造业强国的升级,是我国制造业现阶段的目标.自中国制造2025提出以来,众多中小制造业也在考虑如何在这个效率竞争爆发的时代跟上步伐,突破现有的窘境,成为行
竞争情报是企业通过搜集、分析后得到的关于竞争环境的信息。竞争情报系统则是企业感知竞争环境变化、了解竞争对手动向、制定经营战略和竞争决策的信息系统。企业的竞争优势
“7月9日,当世界杯足球赛决赛在柏林开赛时,这个星球上的五分之一人口,即10多亿人将在观看同一电视画面,这是世界历史进程中的一个新标志。从来没有过像今天这样一个单一的赛
湖北省地处中国中部地区,具有九省通衢的枢纽地位,具有一定的传统产业基础.同时,湖北科教发达,拥有良好的人才优势,有着新一竞争的潜在优势.如何充分发挥湖北的资源优势,将潜
随着社会的发展,档案在社会生活中的重要性日益增强,人们对档案的开放要求也有了进一步的提高.不论是电子政务的发展,还是信息技术的发展都把档案的开放工作提到了一个新的高
为解决大多数网络流量异常检测方法准确度低、误报率高等问题,提出一种基于长短期记忆网络自编码(LSTM-Autoencoder)的网络流量异常检测方法.首先,将真实网络流量从数据包和
文章从功能信息的涵义、特点、作用及其意义出发,对功能信息进行全面论述,通过大量功能信息标引实践,分析总结功能信息的标引规律,制定出一套科学可行的针对北京地方文献的功能
该文在对基于业务流程的目标管理信息系统辩识的基础上,先对MRS管理信息系统(Management Requirement/Modification Request System)的理论基础进行讨论,根据北京多思科技工
摘 要:现阶段,我国国民经济快速发展,各种形式的工程建设在国民经济中发挥了重要的促进作用,社会经济的发展也反过来促进了各项工程的发展。岩土工程作为各项工程建设的基础,自然也越来越受到重视。但是,现阶段我国岩土工程检测中存在许多问题,制约了岩土工程的发展。本文就对岩土工程检测中存在的问题进行分析,并提出了针对性的对策,希望对人们今后开展岩土工程的检测工作有所帮助。  关键词:岩土工程;检测标准;检测