【摘 要】
:
目前,随着科技的发展和普及,学习形式也越来越多样化。在线学习已经成为了一种重要的学习方式,并且每天都有大量的学习视频上传到网上。演讲视频是其中一种非常重要的学习资料,但是这些视频都未结构化,如果用户想要了解演讲视频中某个具体的知识点,他们往往要浏览整个视频才能找到。这种学习方式会大大降低学习者的学习效率。因此,很有必要利用演讲视频摘要技术自动化地提取演讲视频中代表性的知识信息。目前,很大一部分录制
论文部分内容阅读
目前,随着科技的发展和普及,学习形式也越来越多样化。在线学习已经成为了一种重要的学习方式,并且每天都有大量的学习视频上传到网上。演讲视频是其中一种非常重要的学习资料,但是这些视频都未结构化,如果用户想要了解演讲视频中某个具体的知识点,他们往往要浏览整个视频才能找到。这种学习方式会大大降低学习者的学习效率。因此,很有必要利用演讲视频摘要技术自动化地提取演讲视频中代表性的知识信息。目前,很大一部分录制的演讲视频是带幻灯片演讲的视频,在这类视频中,幻灯片切换时刻检测的研究尤其重要。这是因为幻灯片的切换时刻意味着演讲内容的变换,据此可将演讲视频分段,每段针对的是不同的幻灯片内容。本文主要针对带幻灯片演讲视频类型的幻灯片切换检测的研究。给定一个演讲视频,视频中以单个或者多个PTZ(pan-tilt-zoom)镜头记录了幻灯片、演讲者、观众。我们的目标是检测幻灯片内容发生变化的关键帧,其主要研究工作包括:(1)通过稀疏时变图实现对演讲视频幻灯片切换时刻的检测。首先,将输入的演讲视频采样分帧,检测每帧图中的特征点,通过对特征点提取、匹配将输入视频分成若干片段。接着,构建稀疏图,将视频片段视为图的每个节点,故此将检测幻灯片切换问题转化为图的邻接矩阵推论问题。最后,通过我们提出的全局优化算法对一系列稀疏时变的邻接矩阵进行计算,邻接矩阵的改变即可反映出幻灯片切换时刻。(2)利用时空残差网络的深度学习方法实现对演讲视频幻灯片切换时刻的检测。卷积神经网络模型在提取图像特征方面展现了强大的能力,但是它只能提取视频帧的空域信息。而演讲视频中幻灯片切换时刻反映了一段时间内图像的变化,时域信息也是一个非常重要的信息。为了提取视频帧的时域信息,我们引入了3D卷积神经网络模型(3D ConvNet)。3D ConvNet模型在检测视频中空、时域信息方面是一个高效的方法,但是3D ConvNet会消耗大量的显存和需要较长的训练时间。为了优化训练过程,我们在3D ConvNet的基础上添加了残差网络ResNet,取得节省训练时间,提高检测精度的效果。最终,我们提出一种基于3D ConvNet和ResNet的一种全新的网络模型用来检测演讲视频幻灯片切换时刻。
其他文献
近些年来,科研平台信息化管理工作的迅速推进使科研项目文档数据量急速增加。如何挖掘和利用科研文档蕴含的丰富信息,发挥数据的潜在价值,成为了科研平台亟待解决的问题。关键词信息能够高度概括文章主旨、组织文章内容,同时,关键词信息能被用于信息检索、热点分析、文摘生成等文本挖掘的多个领域。因此,对文档关键词信息的挖掘和利用,是发挥文档数据价值的有效方式之一。然而,目前的关键词提取技术提取关键词的准确率不高,
基于洞庭湖流域85个气象站点1961~2016年日降水数据和美国NCEP逐日再分析数据,对洞庭湖流域1961~2016年夏季(6~8月)极端降水事件的成因进行诊断分析。首先,分析夏季极端降水
随着通信技术和计算机设备的迅猛发展,网络化控制系统应运而生。由于其利用网络连接不同地理位置设备原件的特性,使得远程监测和控制系统运行状态成为可能,从而被广泛应用于
轨迹的分析与识别在很多应用场景都非常重要。在本文中,我们提出了一种新的具有高度信息量的原始轨迹表征方式——三维管状模型,并利用其特征进行轨迹运动模式的分析与识别。
地下水污染严重、水生态环境恶化等问题已成为制约经济社会可持续发展的主要因素。因此,亟需开展地下水污染治理与修复工作。准确识别污染源信息是高效治理和修复地下水污染
螺环骨架不仅广泛存在于生物活性天然产物、药物活性分子以及功能材料中,而且在手性配体或催化剂的合成以及现代药物发现中扮演着重要的角色。在众多的螺环骨架中,螺环己二烯
卟啉因其优良的光、电、磁性质被广泛研究。作为有机发光分子,卟啉在稀溶液中表现出强的红色荧光,而在高浓度溶液中荧光发射很微弱,这主要是卟啉分子之间通过范德华力、氢键
传统的观点认为,价值创造指的就是交换价值,在这个过程中,企业是创造价值,并通过价值链将价值传递给顾客,而顾客只是价值的接受者和使用者。随着互联网、云计算、网络经济、
近年来,酰腙作为稳定的亚胺替代物,在有机合成中越来越受到人们的关注。它可以和许多亲核试剂发生反应,生成各种含氮化合物。它发生的常见的反应主要有:酰腙的还原反应、Mann
随着自然语言处理的不断发展,实体关系抽取作为信息抽取中的一个重要子任务受到许多研究者的关注。实体关系抽取可以分为开放域实体关系抽取和限定域实体关系抽取。限定域实