3D视频搜索引擎中3D视频识别和聚类的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:qqqqq770627
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,3D电影在商业上获得了巨大的成功,为3D影视行业带来了巨大的发展。随着互联网的不断发展和计算机性能的不断提高,互联网能够提供越来越高质量的多媒体服务,其中以YouTube为代表的互联网视频服务发展迅猛,3D视频也越来越多地出现于这些视频网站上。3D视频逐渐被消费者所接受,3D显示技术也日趋成熟,这造就了大量的3D视频终端设备的产生,3D电视、3D手机、3D游戏机等各类设备目不暇接。消费者不仅能在影院中享受精彩的3D电影,现在还能通过各种3D终端设备来观看3D视频。在这样的背景下,如何从互联网上的海量视频中选出3D内容,是消费者和视频提供商都会关心的问题。  常用的全文搜索引擎是针对文本内容的,不具有识别搜索主题的能力。如果使用全文搜索引擎来搜索3D视频效果将非常差,会得到大量非视频网页的结果。然而目前的视频搜索引擎大都是基于视频元信息的,所谓视频元信息就是基于视频页面的描述文本提取的关于视频的结构化的文本信息。所以视频搜索引擎实质上还是使用全文搜索引擎的技术,只是将搜索主题限定为视频而已,并不能从视频内容上区分出3D视频。  本文分析了3D视频搜索引擎的关键技术——基于视频内容的3D识别和视频聚类。3D识别是为了把3D视频从普通视频中区分出来,而视频聚类则是把搜索结果归类展示,以提高搜索引擎的可用性。基于全文搜索引擎的原理,设计了3D视频搜索引擎的实现方案,并具体实现了一些部件。通过分析3D视频的不同实现方法、3D视频本身的画面组织方式,总结出了一套基于视频内容的3D识别方案。最后对视频结构进行分析,尤其是对3D格式中最为常见的左右拼接格式和红青色差格式,实现了一种满足3D视频搜索引擎的视频聚类方法。
其他文献
在网络技术不断发展和成熟的时代,越来越多的组织和机构加入互联网,在网络上发布和分享信息。因此,人们获取和管理信息的方式正在从书本向网络上转变,但网络上的信息量日益剧
随着计算机技术的发展和广泛的应用,人们对互联网越来越依赖,萌发了大批的中小型互联网创业企业,大量的传统行业逐渐转移到了互联网。因而网络所带来的威胁已远非从前能比,层
随着3G以及WIFI网络的发展以及网络带宽的提高,视频监控这种直观方便内容丰富的方式成为住宅,交通等领域的重要防范手段。传统的视频监控系统主要用于安全监控产业,摄像前端
汉语的一词多义现象使机器对自然语言的处理带来了许多困难,很多自然语言处理领域的问题归根结底都是解决词语的歧义问题。如何才能让计算机理解一个歧义词在其特定的上下文中
随着各种网络设备和接入技术广泛地应用在有线电视网络中,使得人们对有线电视网络设备全面监控的要求越来越高。由于许多早期有线电视设备(如OmniStar光传输平台)只支持串口通信
随着移动互联网的迅猛发展,移动运营商积累的用户数据越来越多,如何高效、合理地利用这些数据成为一个摆在运营商面前的难题。近年来,推荐系统得到了广泛的应用,借助推荐系统
网格计算是网格系统提供服务的核心部分,它主要包括了元计算,分布式计算,对等计算等先进、成熟的计算技术,它主要针对大型离散的计算资源进行有机的组合,使其汇聚成一个拥有
随着信息技术的不断发展,人们要处理的数据也呈爆炸式增长。为了更好的分析大量的数据,数据仓库(DWMS)系统应运而生。数据仓库更多的被用于数据分析中,因而数据仓库相对于传
注册表是微软开发的一个庞大的树状分层数据库,用来保存操作系统上的软件配置信息、硬件信息、以及一些系统内核的具体调优参数。在Linux和Free BSD下并没有类似注册表这种原
无线体域网是无线传感器网络在生物医疗等领域的一个重要的分支,是由植入人体体内或是可穿戴的分布在人体体表的各类传感器组成的无线网络,可用于监测、采集和管理人体的不同