基于语义的视频内容提取与分析关键技术研究

来源 :南京航空航天大学 | 被引量 : 4次 | 上传用户:LoneStrong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着多媒体技术和网络技术的快速发展,出现大量的以视频为主的多媒体数据。如何有效的处理这些海量的视频数据是目前一个研究的热点问题。其中“语义鸿沟”是人与计算机系统交互中的一个重要障碍,这是由于人对视觉媒体的评判标准和计算机系统对视觉媒体的评判标准存在着很大差异。由于计算机系统通常利用颜色、纹理和形状等底层特征进行视频结构分析,然而人们更倾向于利用内容以及语义级别的检索方式进行视频检索。如何减少计算机系统和人类之间的“语义鸿沟”是目前基于内容的视频检索等领域的一个重要突破点。其中视频内容的提取与检索就是解决“语义鸿沟”的重要手段。虽然对于基于内容的视频检索有了很多研究,但这项技术还远远不能满足用户的普遍需求。本文对基于语义的视频内容提取与分析的几个关键技术进行了研究,研究主要集中于如何自动提取与分析视频内容,实现视频数据的半自动或自动分析和归类,以满足检索的需要。本文分析了传统三层内容分析架构的不足。在此基础上,提出了四层内容分析架构:基本视觉内容层、感知内容层、目标内容层以及场景内容层。通过增加的感知内容层可以更好的解决计算机系统与人类之间的“语义鸿沟”问题。本文的主要研究成果包括:(1)在视觉感知内容层面,重点研究了基于视觉注意模型的感知内容提取模型,并在此基础上提出了动态场景下的视觉显著图生成方法(Salient Map Generation on Dynamic Scene, SMGDS )以及基于时空模型的快速视觉显著图生成方法(Salient Map Generation using Temporal-Spatial Model, SMGTSM)。SMGDS算法通过运动轨迹等运动特征实现了动态场景下的视觉显著图的稳定生成。而SMGTSM则利用一种无监督聚类算法实现了视觉显著图的实时生成。通过SMGDS和SMGTSM有效地实现了视频感知内容的提取,为感知内容层提取奠定了基础。(2)在目标内容层面上,着重于监控视频的目标提取。分别提出了复杂背景下的自适应前景分割算法(Adaptive Foreground Segmentation in Dynamic Scene, AFSDS)和利用背景聚类的快速前景分割算法(Fast Foreground Segmentation using Background Clustering, FFSBC)。在分析了现有基于高斯混合模型前景分割算法的缺陷后,AFSDS和FFSBC算法分别在目标检测精度和速度两个方法对现有的高斯混合模型(MOG)算法进行了改进。实验证明AFSDS和FFSBC可以在复杂场景下有效地检测出运动前景,显著地提高了检测精度和速度。(3)在分析了具体场景特点的基础上,提出了针对故事片中出现的人物自动索引算法(Automatic People Indexing in Video, APIV)。APIV算法首先用人脸检测算法检测出视频出现的人物,再提取衣着颜色和声音两种特征构成特征向量,最后通过提出的新的无监督聚类算法实现了视频中出现的人物的自动聚类。APIV算法解决了传统方法中需要靠人工对视频中出现人物进行手工标注的问题,能够自动的对视频中出现的人物进行聚类。对于大量的视频进行实验,实验证明了APIV算法的有效性和实用性。APIV为现有场景内容分析方法提供了一种有效的补充。(4)视频摘要是视频内容的压缩和摘要。在分析了现有视频摘要生成方法的不足的基础上,提出一种基于视觉感知内容的视频摘要生成方法(Key-frame Extraction using Visual Attention Model in Video, KEVAMV)。KEVAMV算法利用了视觉注意模型,提取了视觉注意度(Visual Attention Index, VAI)作为特征,并根据VAI的变化自动生成优化的视频摘要。KEVAMV方法相对传统方法而言,可以根据人的视觉特点,提取用户较为感兴趣的关键帧。本文的研究是基于目前用户对视频内容分析的迫切应用需求和广泛的应用前景展开的。主要研究了视频内容提取与检索的关键技术,从而用户可以简单而有效地获取感兴趣的视频内容。
其他文献
介绍了天然气分布式能源的优势,从分布式能源政策以及国内天然气分布式能源项目布局建设情况两个角度分别剖析天然气分布式能源项目现状,同时根据调研情况对天然气分布式能源
科教协同培养是以企业、高校科研院所为主体的科研价值创新与教学实践相结合,通过贯彻“做中学”的教育新理念来实现知识增值;而知识增值却是知识管理的根本目标,是支撑现代
第一部分大鼠骨髓间充质干细胞的培养、鉴定、成骨诱导分化和USPIO标记目的:通过体外法分离、培养、扩增、鉴定及成骨诱导分化BMSCs,并对扩增的BMSCs行USPIO标记,观察BMSCs的生物学特性及USPIO标记后BMSCs的细胞活力。方法:1.在无菌条件下分离大鼠的股骨,采用全贴壁法培养、扩增BMSCs。2.通过流式细胞仪鉴定培养细胞的表面抗原,明确目的细胞的纯度。3.对扩增的BMSCs行成骨
存货是企业经济运行的起点,正确地处理存货的计价、耗用、结存等问题对确认企业会计要素十分重要。因此,文章对新存货会计准则进行了分析,并就新旧准则的差异进行了比较和研
目的 探索制约脑瘫患儿早期干预实现的因素,为开展健康教育、促进患儿的基本康复提供依据。方法 对淄博社区居民、淄博市级医院儿科门诊或首次入院康复的脑瘫患儿家属及基层
进入新世纪,随着微电子、计算机、网络以及多媒体等技术的迅速发展和普及,计算机软件已渗透到人类社会生活的各个角落,出现了计算无处不在的新局面。软件在功能不断增强的同
借助巴特勒的性别操演学说及其相关的身体理论研究成果,在反思传统男女社会性别刻板印象的基础上,结合娱乐圈的超女和美男现象,诠释当下以中性风格为审美特征的男女社会性别
通过对湖北省水稻生产现状及发展条件的分析,提出了湖北省水稻生产的发展策略及科技需求。
本文通过对商务英语学科定位的分析,借鉴应用语言学和专门用途英语的理论研究成果,对商务英语教学的特征和案例教学模式进行了分析和研究,指出将案例教学引入商务英语教学体现了
构建数据仓库是客户关系管理系统中的基础,针对大规模定制企业的企业特性,本文先提出了大规模定制企业客户关系管理系统,以及数据仓库在大规模定制企业中具备的职能,主要阐述了大