基于小波变换的视频镜头聚类与查询处理技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:lhmsgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通信技术、宽带网络技术、音视频压缩技术以及计算机技术的发展,数字视频越来越广泛地融入于人们的生活空间中。由于视频数据自身内容的丰富性和多样性、结构的复杂性以及具有时空多维结构性,传统的数据管理与检索方案不能够很好地从巨大的视频数据源中找到所需要的信息。如何有效地对这些视频数据进行组织、表达、存储和管理,以及如何对其进行快速检索与浏览等已成为视频领域内急待解决的重大课题。   在这种研究背景下,本文分析了现有的视频镜头检索方法存在的问题和不足,并在此基础上对镜头表达、镜头聚类、镜头索引以及查询处理方面做了深入的研究。其主要工作和主要贡献有:   (1)提出了一种基于Haar小波变换的镜头表达方法。通过理论分析,证明了在当今被广泛使用的、用于表达镜头的高维特征向量空间与Haar小波系数空间进行空间转换的过程中,不同镜头之间的相互关系保持不变。利用Haar小波系数来表达镜头,还能在对镜头的查询处理中正确、有效的过滤查询空间。除此之外,通过实验发现,该表达方法只需要利用少量的小波系数就可以很好地表达出镜头所包含的高维特征。   (2)提出了一种基于多分辨率分析的多级层次聚类算法MLHC。在把镜头的高维特征用Haar小波系数加以表达之后,算法利用多分辨率分析理论实现了逐步求准聚类结果的目的。算法的每一步求准聚类结果的过程都是一次独立的层次聚类过程,并且这个过程利用了一种设计巧妙的停止准则来使算法的循环过程结束。该算法在解决了以往镜头聚类算法中存在的聚类中心选取问题以及需要给出相关领域经验参数的问题的同时,还能够自动对聚类个数进行估计。   (3)在基于Haar小波变换的镜头表达方法的基础上,利用R树这种索引结构,实现了对镜头快速有效的查询处理。该查询处理过程充分利用了多分辨率分析理论,有效地过滤了查询空间、减少了查询代价,提高了查询速度。  
其他文献
随着无线网络与可移动设备的发展,移动计算正逐步成为分布式计算的主流,移动计算使得人们在保持网络连接的同时能够自由移动,这促进了许多新的分布式应用的出现。但是移动计
随着我国信息化进程的深入和电子政务的建设,大量的社会和经济信息已经电子化。而由于国际政治经济的交流和发展,如何向世界范围内发布这些相关的信息成为一个现实需求。近年
自然界中生物体优胜劣汰,不断由低级向高级进化。人们通过观察这些适者生存的法则构成了一些优化算法。优化算法的本质是在众多解中寻找到一个最优的解,使得系统在满足一定约
由于Web上海量的信息处于不断的变化中,通用搜索引擎已经很难再为用户提供一个准确并且更新及时的信息搜索服务,其局限性在于它试图索引全部Web并且试图服务于所有主题的查询请
随着用户对数据安全和数据有效利用的要求不断提高,备份系统对数据的处理已经不再是简单的数据拷贝,而是存在大量种类繁多、功能各异的数据处理。目前现有的备份系统虽然功能强
随着网络的普及,信息处理技术有了一些新的应用领域,例如,传感器网络,网上在线交易系统,股票行情实时监控。在这些应用中,数据不再是静态的,而是一种实时的、不稳定的流式数
随着信息技术的发展,彩色图像以及视频的应用更加广泛,由于图像的最终观察者是人,因此研究人眼的视觉特性,寻找一种模拟人眼视觉特性的显著区域提取无疑是一条重要的途径,如
随着计算机和互联网技术的发展,越来越多的信息被放在了互联网上,由于网络快速和便捷的特性,传统媒体和和交流社区还有企业都开始电子化,网络化,网络上的信息也越来越多的在
随着社会的不断发展,如何能够有力地保障人们的生命财产安全以及维护社会的持续稳定的发展,创建“平安城市”,建立起高效、科学的城市监控系统正在成为各级政府日益关注的建
移动机器人的研究和开发近年来受到了人们的高度重视。人们要求机器人在运动过程中能够根据周围环境的变化而自主的采取相应措施的能力也越来越强。因此,作为机器人智能的一