基于演化算法的视频场景分割

来源 :厦门大学 | 被引量 : 0次 | 上传用户:yuyanbbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术在视频方面应用的发展,让计算机理解视频内容成为现代计算机视觉技术研究的重点。视频场景分割是实现视频语义理解的第一步,也是实现视频数据高效浏览与索引的关键性步骤。场景分割是在一个较高的层次上对视频进行分割,它需要在视频镜头检测与镜头关键帧提取的基础之上,综合运用视频场景检测专业知识来实现。镜头检测是场景检测的前提,本文在充分调研目前数字视频技术、视频分割技术的基础上提出了一种基于HSV颜色空间的镜头新检测方法;在计算机视频场景自动检测方面,本文首次将演化算法引入到视频场景分割领域,产生了一种与现有方法完全不同的场景检测新技术。 本文提出的基于HSV颜色空视频镜头检测算法,首先,把视频帧图像从RGB颜色空间映射到HSV颜色空间。然后,重新量化图像的H与S分量到127个彩色区域。最后,通过直方图方式计算图像的帧间相似性。同时,算法采取了有效的虚假镜头分割分析机制,以减少图像快速变化的影响。实验结果表明,本算法不仅具有较高的准确率、查全率和较快的处理速度,而且算法运行能克服光线变化和运动的影响,因此在视频镜头分割领域具有一定的实用性,能很好与本文提出的场景检测算法配合实现场景检测。 演化算法本质上是一种不依赖具体问题的直接搜索方法。通过自然选择、遗传、变异等作用机制,实现提高各个个体的适应性。基于演化算法的视频场景检测是一种全新的场景分割技术。本文在场景检测过程中,将每个镜头的分割点视为一个基因,运用独特的基因编码方式、种群演化规则和个体评价机制,形成了一种简单高效的视频场景分割方法。实验结果表明,该方法分割精度比较高,且运行速度快,在场景分割应用上具有较强的技术实用性。
其他文献
G(o)del语言是继Prolog语言之后出现的新型说明性通用逻辑程序设计语言,它建立在多态多类的一阶逻辑基础之上,摒弃了Prolog语言中的非逻辑成分,集成了多种语言的有效成分和优点,
测试用例生成作为软件测试最为关键的环节,它是需要耗费大量的劳动力和时间的步骤,因此对于测试用例的自动生成已经成为了一种迫切的需求。同时,在软件开发过程中,UML已经成为了
目前,我国风电事业迅速发展,推动了风电场信息化建设的步伐。但在这个过程中,因风电场设备时间跨度大,设备型号种类多,各个风轮机组信息模型及通信协议各不相同,使得用传统技
办公文档应用的广泛性,不仅要求一种文档格式能够被不同办公软件理解和应用,还要求不同的文档格式之间能够相互转换和存储。针对办公文档格式多个标准共存、各标准互不兼容的现
由于高吞吐率和高容量存储系统的需求牵引,网络存储体系结构正经历着重要的变化。基于对象的存储是一种非常有前景的网络存储模型。在该模型中,文件被分割成一个或多个对象存储
负载均衡(Load-balancing)技术用于分布式系统中以求达到资源的有效利用,但现有的负载均衡系统大多采用广播或轮循的方式去提取负载信息,占用了大量的系统资源且效率低下,并
由于因特网的普及及日益增长的对多媒体服务的需求,因特网上的流媒体技术已经吸引了越来越多的关注。自从20世纪九十年代初被提出以来,流媒体技术已在世界范围内得到广范应用
随着科学技术的不断发展,各种需求的不断提出,定位技术的应用场景也越来也丰富,尤其是在恶劣的自然环境或大范围的场所,如煤场,要求对进场车辆进行严格的位置确定,而煤场煤坑
专利是人类的知识成果,最大程度的开发利用专利知识,可以为国家和企业缩短时间,节省费用。专利知识抽取,作为深层次理解专利内容的重要基础,日益成为专利研究的热点,直接影响着专利
求解任意给定的两个字符串的最长公共子序列(LCS)的问题是计算机科学中一个基本和重要的问题,它是一种仅仅允许对模式和正文进行插入和删除编辑操作的近似串匹配问题。最长公