基于内容的MPEG视频检索关键技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:lily009009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络及多媒体技术的迅速发展,数字视频的应用越来越广泛,海量的视频信息不断涌现,如何从这些内容丰富的视频中找出自己感兴趣的视频段进行播放和浏览,是人们普遍关注的一个问题。因此,为了有效地对视频进行分析和检索,在信息学科形成了一个全新的领域--基于内容的视频检索(Content-BasedVideoRetrieval,CBVR)技术。 对视频进行基于内容的检索和浏览,首先要对视频进行结构化。结构化的视频包含帧、镜头、场景和逻辑故事单元等部分。因此,基于内容的视频检索包括镜头的分割、关键帧的提取和场景转换检测等。其中镜头边界检测是基于内容的视频检索的第一步。镜头边界的检测包括对突变的检测和对渐变的检测。然后对检测出来的镜头提取一帧或多帧关键帧来代表它的主要内容。最后利用关键帧来构造场景和逻辑故事单元。 目前越来越多的视频以压缩形式存储,如何对这些视频进行压缩域内的检索显得更加重要。本文针对MPEG视频进行了压缩域内的镜头边界检测和关键帧提取等关键技术的研究。 本文在对压缩域内的镜头边界检测技术进行深入研究的基础上,提出了一种压缩域内镜头边界精确检测的方法。首先只对压缩视频的I帧进行部分解码,取得每个8*8块的直流系数构成其相应的DC图并提取DC图的特征,然后对于突变的检测,是利用DC图特征的差异将镜头粗略切分,再利用粗略切分位置的前一个GOP内压缩码流本身所包含的B帧的运动信息来精确定位镜头边缘:对于渐变的检测利用提出的CDDC(ContinuousDifferenceofDC-picture)算法粗略定位渐变的范围,再对粗略检测出的渐变范围内P帧的帧内编码宏块的变化进行分析,来精确定位渐变的起始帧与结束帧。这样,利用压缩码流中B、P帧的运动信息分别对突变镜头和渐变镜头进行精确定位,弥补了压缩域中镜头定位精确性不高的缺点,使得本文中采取的算法具有效率高,精确度高的特点。 对于关键帧的提取,本文中采用一种能较全面反映视频内容变化的关键帧提取方法,即根据视频段的内容选取不定数量的关键帧。
其他文献
随着Internet的迅猛发展,应用服务器需要为越来越多的用户提供服务,在这种情况下,即使单台服务器性能再高,所能提供的服务也是有限的,且存在单点失效等问题。目前,J2EE已成为
蜜罐和蜜网技术为捕获并深入分析黑客的攻击行为提供了基础。但是,现有的蜜罐和蜜网技术存在容易被黑客发现、取证的合法性等问题,一般用作研究工具,在实际网络中应用时存在给应
搜索引擎存在的问题是查全率和查准率都比较低,垂直搜索服务的出现提高了用户检索特定主题的查准率。然而互联网上大量面向特定主题的垂直搜索引擎和综合搜索引擎的出现,使用
人脸识别,是指利用计算机技术分析比较人脸视觉特征进行身份鉴别的一种生物特征识别技术。它是图像处理和模式识别的研究热点之一。在身份验证、访问控制和视频监控等领域具有
自行火炮是一种集光、机、电各种技术于一体的大型复杂装备,随着部队自行火炮装备数量和装备年限的逐步增加,对装备的使用、管理提出了新的要求。而现行的对自行火炮的管理方式
近年来,随着多媒体存储与传输技术的不断进步,特别是Internet技术的盛行,带动了数字媒体应用的迅猛发展。这些技术给人们带来了极大的方便,但随之而来的副作用也十分明显。任何人
矩形件排样问题在很多工业领域都有广泛应用,解决好矩形件排样的布局优化问题,可以提高材料的利用率,节约生产成本,提高效益,从而使企业增强竞争力。 本文针对排样的布局优化问
随着信息技术和移动互联网技术的快速发展,终端远程访问企业内网数据资源的需求日益迫切。但移动互联网的开放特点无法保证其信息通信的安全性,如何实现移动终端与企业网络之
随着语义Web的发展,基于本体的应用越来越多。由于本体开发与存储具有分布式的特点,在信息量庞大的万维网上方便快捷地定位合适的本体是非常困难的。 Falcon—F正是为克服这
Turbo码由于其接近Shannon限的突出纠错能力,成为编码理论的一个重要里程碑。其优异的纠错性能,受到了人们的广泛重视,也成为了目前信道编码领域的重要研究热点之一。本论文就Tu