视频镜头动态聚类算法在数字图书馆中的应用研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:guanxinpp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的不断发展、科学技术水平的不断提升,互联网上的数字视频正不受限制地增长并且逐渐成长为一种新型的力量。这些视频大多数存储在非结构化的存储库中,因而对图像和视频检索的研究和开发任务构成了巨大的挑战。由于视频本身包含有丰富信息的特点,导致采用人工标注视频内容属性信息的方法有很大的不足。基于当前这样的情况,如何让计算机自动提取视频的内容特征与视频检索技术已经成为目前亟待解决的课题。近几年来,随着基于内容的视频检索技术快速发展和人工智能技术的突破,越来越多的研究人员和学者投入到该领域的研究中来。视频检索领域中涉及到的核心技术主要有镜头分割、关键帧提取、视频匹配和视频检索,其中视频的镜头分割和关键帧提取技术成为了当前数字视频检索系统发展的关键步骤。本文详细研究了AP聚类算法(近邻传播聚类算法),并将基于AP聚类的优化算法应用到视频关键帧提取中,以此来提高数字图书馆视频检索系统中检索结果的准确率和效率。本文的主要研究内容及方法如下:(1)优化视频相邻帧间差计算方法。针对视频镜头分割步骤,传统的视频帧的颜色特征提取方法仅仅是对颜色值进行统计和整理,而没有考虑空间分布情况,为了使颜色特征更具有代表性,本文提出了一种基于视频帧内容的区域分块计算方法将空间信息与颜色特征进行了融合,并依据一个视频帧的不同位置的颜色提供的信息量各不相同为理论依据,对帧进行分块处理并分配不同的权重,自动调整各分块区域的重要性权值,从而提高了镜头边界检测算法的鲁棒性和普适性。(2)提出自适应镜头聚类算法提取关键帧。关键帧提取是视频检索中的重要环节,采用常见的聚类算法提取关键帧产生的漏检帧和冗余帧总是影响着关键帧提取结果的精确度和效率。为了尽量减少漏检帧和冗余帧带来的影响,本文在基于AP聚类算法上进行优化,具体方法是先依据每副帧所表达的信息不同,在算法的初始相关系数矩阵中增加权重,同时,一个视频帧的数量普遍较多,采用自适应方法调整阻尼系数来避免聚类算法收敛时候的震荡。通过实验结果验证,本文提出的方法有效地解决了提取关键帧方法中时间复杂度高和视觉信息低效的问题。(3)研究镜头动态聚类算法在数字图书馆的应用。结合重庆理工大学图书馆里面的数字视频栏目,对数字图书馆中的学习视频以及视频检索方案进行需求分析,提出了视频检索的设计目标和设计思路,建立数字图书馆视频数据库,进行视频检索实验,实验结果表明,改进的动态聚类算法在保证时间复杂度的情况下,提高了数字图书馆的视频检索效率。
其他文献
动态场景图像置换技术,是将视频中每一帧图像中的一个或多个目标事物,根据用户需求用其他感兴趣的图像事物置换掉或将其置于新的背景下得到一组新的图像序列,从而得到一个新
受环境污染和能源危机的影响,电动汽车成为了汽车制造业未来发展的主要趋势,在电动汽车中,驱动电机控制系统的优劣决定着电动汽车驾驶的舒适性与稳定性,永磁同步电机以其高效率、高功率密度以及优良的控制性能成为了电动汽车驱动电机的首选。本文针对电动汽车电机驱动系统,对电动汽车用永磁同步电机控制算法以及无速度传感器技术进行研究与改进,主要包括以下内容:首先,研究了基于SVPWM的直接转矩控制策略,SVPWM可
互联网技术的迅猛发展和快速普及,直接影响着人们生活的方方面面,人类的社会行为也在潜移默化中发生着变化。高度信息化的社会像一个巨大的网络将地球上的万物包罗其中,地球
随着RFID技术的不断发展,RFID的应用越来越广泛,其中包含关系探测受到国内外学术界和产业界的广泛关注。现实生活中广泛存在包含关系,这种关系相比于标签对象间简单的伙伴关
随着移动技术的快速发展,基于位置服务的应用使人们的生活越来越便捷,用户在享受便捷服务的同时,个人数据的隐私泄露问题也愈发严重。本地化差分隐私,由于其继承了中心化隐私保护方法被广泛应用于保护用户个人的敏感信息,已经成为当前研究的热点问题之一。基于本地差分隐私下的发布数据所采用的方法有数据扰动、数据压缩和数据扭曲三种方式,其中最为常用的是随机聚集有序相应隐私保护方法(RAPPOR,Randomized
随着云计算的发展,产生了面向组件服务的云应用系统。云应用系统以业务流形式向用户提供服务,而不同的业务流中的不同任务被分配到不同的组件服务上,这些组件服务共同构建应
随着信息技术的高速发展和智能手机的普及,基于手机的室内定位技术逐渐成为研究的热点。目前在室内定位技术中,基于地磁匹配(MagneticMatching,MM)的室内定位方法,无需额外设
主从式遥操作微创手术机器人是国内外医疗领域的研究重点。微创手术可以为患者和医生带来诸多好处,如切口小、手术时间短、恢复时间快等。力反馈是当今微创手术机器人的研究
智能终端的普及与无线网络技术的进步推动了实时流媒体业务的蓬勃发展。如何通过多模终端的无线网络接口,利用多路径传输技术并发传输数据,为实时流媒体业务提供高质量的传输
目前,OCR技术对简单版面的分析已经解决并得到了一定的普及,然而随着信息时代的到来,文本图像的版面已经不再是简单的文字和图形的组合,而是涵盖了文本、表格、图形和图像等