基于卷积神经网络的视频镜头边界检测

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:guobinlei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
镜头边界检测是视频语义分析和编辑任务的重要预处理步骤,旨在检测出视频中镜头的切变和渐变,实现对镜头的自动分割;如何高效且准确地识别出视频中的镜头边界仍然是一项挑战。目前大多数镜头边界检测方法基于精心设计的手工特征,检测效果严重依赖于经验确定的参数,可扩展性不强。这些方法往往通过设计更复杂的特征、相似度度量方法或者分类方法以提高检测准确度,计算代价大且实现复杂。针对以上问题,构建了一个基于深度卷积神经网络的镜头边界检测模型。整个模型分为三个阶段。第一阶段初步定位出视频中可能发生镜头切换的位置,使用卷积神经网络的高层输出作为视频帧的特征表示,计算相邻帧之间的差异度,快速排除大部分非镜头边界帧。针对渐变长度多变的特性,采用多个时间尺度对视频进行下采样,然后合并不同尺度下获得的候选边界帧。第二阶段利用三维卷积神经网络识别出候选边界帧中的切变,并基于检测网络输出的渐变概率初步定位出视频中可能发生渐变的位置。第三阶段进一步定位出渐变的时间边界,利用卷积神经网络判断每一帧属于渐变开始、中间和结束三种状态的概率,然后通过定位这三种概率信号的强峰值,确定出渐变过程的起止时间。使用公共数据集ClipShots对模型进行训练并测试。实验结果表明检测模型对切变和渐变都具有不错的检测效果;渐变检测性能略差一些,且存在大量重复计算。如何提高渐变检测性能并减少计算量,还有待于进一步研究。
其他文献
目的:探讨不同口腔鳞癌细胞的缺氧诱导因子-1α的表达水平,阐明口腔鳞癌细胞对5-FU的敏感性是否与其表达水平相关。方法:将OSC2、OSC4、OSC5、OSC6口腔鳞癌细胞培养并检测其缺
目的:探讨血清T—PSA、F—PSA检测在前列腺癌(PCa)诊断中的应用价值。方法:运用酶联免疫方法检测28例前列腺癌患者、50例前列腺增生(BPH)患者和20例健康成年男性血清中T—PSA、F—P
永磁同步电机(permanent magnet synchronous motor,PMSM)是一个多变量、强耦合的时变非线性复杂系统,传统PI控制已很难满足对PMSM伺服系统转速控制的高精度要求。本文通过对PMSM矢量控制系统中转速环的设计来提高电机转速的控制精度。复合控制常被用于PMSM的伺服控制系统设计。首先,本文在标准蝗虫优化算法(GOA)的基础上设计了正余混沌蝗虫优化算法(SCCGOA)