【摘 要】
:
由于图像采集技术的应用和互联网、物联网技术的发展,人们可以很方便地在电脑上或手机上制作和分享视频。最近几十年,由于越来越多的人参与到视频的制作和分享过程中来,造成每天有海量的视频被上传到互联网上,这使得互联网上的视频数量呈现指数级的增长趋势。这些视频的内容种类繁多,有新闻视频、影视视频、监控录像、视频日志(vlog)等。种类繁多的视频数据,既丰富了人们的社交生活,也极大地拓宽了人们获取各种信息、了
论文部分内容阅读
由于图像采集技术的应用和互联网、物联网技术的发展,人们可以很方便地在电脑上或手机上制作和分享视频。最近几十年,由于越来越多的人参与到视频的制作和分享过程中来,造成每天有海量的视频被上传到互联网上,这使得互联网上的视频数量呈现指数级的增长趋势。这些视频的内容种类繁多,有新闻视频、影视视频、监控录像、视频日志(vlog)等。种类繁多的视频数据,既丰富了人们的社交生活,也极大地拓宽了人们获取各种信息、了解新鲜事物和外部世界的方式。但同时也带来了许多急需解决的问题,比如在视频存储、传播和检索等方面给使用者带来了极大的压力和困难。为了克服上面提出的视频检索困难、传播效率低等问题,视频摘要技术应运而生,并逐渐引起了越来越多人的关注。经过计算生成的摘要视频是对原始视频的高度概括,保留了原始视频中的重要信息。视频摘要技术一个非常重要的特点是其形式多种多样。视频摘要既可以由静态视频帧组成也可以由动态视频片段组成,甚至可以把原始视频中不同空间和时间的移动目标拼接在一起,生成全新的视频内容,但是不管什么形式的视频摘要,其长度和观看时间都应该小于原始视频,从而帮助用户快速浏览原始视频,并获取视频中的关键信息。因此能够提取视频中重要信息的视频摘要技术成为了近几年计算机领域的热门课题。本文将采用深度学习算法针对该问题进行深入研究,具体工作内容包括:(1)提出一种基于全卷积序列网络的视频摘要模型,模型中利用时间金字塔池化对视频中的多尺度上下文信息进行提取,针对场景变化繁复、镜头较多的视频,产生了较好的效果。同时利用全连接的条件随机场对视频帧序列进行标注,使模型在视频帧的分类细节进行了加强,并将模型在TVSum和Sum Me进行训练和验证,相比于原有的全卷积序列网络,该模型取得了更好的性能。(2)针对现有的方法在对输入视频做预处理时,仅仅提取了视频中的图像特征而忽略了视频中的音频特征,提出了一种基于卷积神经网络的音视频特征融合方法。经过音视频特征的融合,将融合后的特征在TVSum、Sum Me数据集上进行实验并对结果进行分析。最终结果显示,多模态融合后的特征,弥补了单一图像特征的不足,该算法相比目前先进的方法取得了更好的性能。(3)提出一种基于全卷积序列网络的生成式对抗网络模型。将改进后的全卷积序列网络作为生成式对抗网络的生成器。然后将生成器的编码器部分生成的特征向量经过处理映射为一个分数,用来判断输入的摘要视频是否为真正的摘要视频。我们将这个改造后的网络结构作为生成式对抗网络的判别器。经过生成器和判别器的对抗训练,使生成器能够生成更具有多样性和代表性的视频摘要。
其他文献
大量研究证实测试可以比相同时间的重学产生更好的学习效果,这一现象被称为测试效应。此外,许多研究显示对于将要学习的材料而言,学习者自己生成的信息比他人生成或重读更有利于记忆,这一现象被称为生成效应。就学习策略的有效性而言,测试和生成问题都可以作为初始学习的有益后续,但究竟哪一种学习策略更有效还有待进一步论证。另外,就测试条件而言,开/闭卷是否会影响学习策略的有效性仍保存争议。目前比较测试和生成问题两
目的 建立反相高效液相色谱法(reverse phase high performance liquid chromatography, RP-HPLC)检测白喉毒素无毒突变体CRM197蛋白纯度。方法 利用Agilent AdvanceBio RP-mAb SB-C8(100 mm×2.1 mm)分析柱和Agilent1260高效液相色谱系统,以含0.1%三氟乙酸水溶液-异丙醇(98∶2)为流动
《中庸》是中国儒家经典著作之一,有着丰富的人生哲理,对今天的社会实践仍有指导意义。迄今为止,《中庸》译介到西方已经有近200年的历史,最早于19世纪由英国传教士译介到西方。20世纪,《中庸》英译蓬勃发展,期间出现了辜鸿铭等译者翻译的十几种版本,这些译本把目的语文化当作中心,采取了归化翻译法,用西方的哲学概念解读《中庸》,忽略了中国哲学的“他性”。21世纪初,安乐哲推出的《中庸》英译本,采用异化译法
纸盒无菌包装是食品无菌包装的主要形式之一,具有易成型、阻隔性强、机械强度高、热封性好等优势,目前已工程化应用的包装结构主要为三角型、枕型、砖型、钻石型、屋顶盒型;其中屋顶盒具有独特顶部屋顶造型结构,长期以来被应用为巴氏杀菌牛奶的包装。为进一步拓展屋顶盒的应用,近年来工程界开始尝试将其推广应用于长货架期、常温保存产品的包装,但其特殊纸盒结构成型工艺致使现有包装材料灭菌工艺无法满足产品包装要求,为此亟
教师的知识体系、专业技能、教学方式与教学观念等教师能力,必须适应社会的快速发展和人才培养的需要,不断提升自己的专业水平,才能更好的以四有好老师为目标,为党育才,为国育人。信息技术的快速发展,为教师职后发展提供了丰富的资源和方法,教研活动是学校教育过程中的重要内容。本文研究在数字化背景下,利用网络教研方式,提升教师职业素养与能力,突破时空限制的网络教研活动,创新教师专业能力发展的理念与思路。
双螺杆压缩机具有动力平衡好、单级压力比高和容积效率高等特点,在化工、制药、石油等行业得到了广泛应用。双螺杆压缩机转子型线的优劣直接决定了压缩机性能的优劣,因此要提高压缩机的能效,必须设计出一款型线更优的螺杆转子。本课题从双螺杆压缩机的综合性能和转子型线的自动寻优角度出发,对单级因素综合性能指标和多级因素综合性能指标以及转子型线的自动寻优方法进行研究。分析双螺杆压缩机的结构和工作原理,讨论第一代到第
铝基复合材料凭借质量轻和强度高的特点被广泛应用在机械工业和航空航天领域,而石墨烯以良好的力学性能和超高的比表面积被认为是金属复合材料中的理想增强体。相关研究表明,石墨烯增强体在金属基复合材料的界面载荷传递以及塑性变形中起着重要作用,但关于石墨烯增强铝基复合材料的力学性能和微观研究仍缺乏系统的分析。本文采用分子动力学方法研究了石墨烯/铝基复合材料在拉伸、压缩和纳米压痕载荷作用下的力学响应,探究了铝基
随着社会的发展,特别是现代社会在石油、化工方面的发展,压力能的应用前景广阔,双螺杆压缩机成为工业发展的各个部门不可或缺的关键机械设备之一。因此,对于双螺杆压缩机的性能的要求也越来越高,所以双螺杆压缩机的动态特性以及噪声的研究一直是双螺杆压缩机研究的关键领域。本文运用Matlab、UG、LMS Virtual.Lab等软件,围绕双螺杆压缩机的动力学特性、壳体振动响应以及声辐射特性等开展研究。通过对压
316L不锈钢材料因其具有优异的抗晶间腐蚀性能以及抗高温氧化性被广泛地应用于军工、化工、生物医学以及造船运输等领域,但其存在的低硬度、低强度等问题限制其进一步的发展。为改善316L不锈钢的力学性能,本文以MnSi2粉末为增强颗粒,利用SLM技术成形MnSi2/316L不锈钢复合材料,以改善复合材料成形质量、机械性能和耐腐蚀性能为目标,对SLM成形工艺展开研究,采用GA遗传算法对SLM成形工艺参数进
实际系统的结构和参数有时会发生变化,可能是因为遭遇到环境条件突变、设备故障突发或者工作点突变等。作为一种混杂系统,马尔科夫跳变系统(Markov Jump Systems,MJSs)可以用来描述这种随机的情况。与MJSs相比,半马尔科夫跳变系统(Semi-Markov Jump Systems,SMJSs)不仅服从单一的指数分布,也服从高斯分布、威布尔分布等其它更一般的分布,在实际场景中有着更广泛