基于稠密扩张卷积网络的时序行为检测

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：gomo08

【摘要】

：

【作者】

：

朱时兵

【出处】

：

电子科技大学

【发表日期】

：

2020年01期

【关键词】

：

深度学习行为检测行为识别多尺度扩张卷积稠密网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着深度学习技术在计算机视觉领域日益发展,人工智能时代的脚步离我们越来越近。特别地,由于在安防、人机交互、视频分析等方向表现出十分有潜力的应用前景,视频时序行为检测任务引起科研界研究人员的广泛关注,随之而来的是层出不穷和日新月异的研究成果。与行为识别任务有所区别的是,在未处理的长视频之上,行为检测不仅需要输出行为类别,而且更重要地需要定位出行为片段的精确的起始和结束时间,这是一项更富挑战的计算机视觉任务。行为识别与行为检测之间的关系同图像分类和目标检测之间的关系很像。基于图像分类问题,发展出了许多强大的网络模型如残差网络,这些模型在目标检测的方法中也起到了很大的作用。同样,行为识别的相关模型如双流网络,在时序行为检测中也被广泛应用。由于行为识别和行为检测之间存在一定的相似性,所以很多行为检测框架都采用了和目标检测方法相似的框架。行为检测任务的挑战大致总结为三点:首先,在目标检测中物体目标的边界通常是非常明确的,所以可以标注出较为明确的边界框。但时序行为检测的边界很多时候并不是很明确,开始和结束时间在帧级上很难精确;其次,只使用静态图像的信息,而不结合时序信息在行为识别中通常也可以得到比较不错的效果,但是在时序行为检测中,由于边界定位对时序信息有很强的依赖,必须结合时序信息;最后,时序行为片段的时间跨度变化可能比较大,在有些数据集中,最短行为片段可能只有一秒,然而最长的行为片段超过10秒。这对网络对多尺度信息和长时序信息的捕捉能力是要求很高的。本文提出了一种基于稠密扩张卷积的一种新颖的有效捕捉多尺度和长时序信息的网络模块(Dense Dilated Temporal Network,DDTN)。该模块提炼了扩张卷积可以在不丢失信息的前提下扩大感受野尺寸和稠密网络对信息高效融合和传播的优势,并对通过设定稠密模块内扩张系数恒定和模块间扩张系数递增的模式将二者有机结合在一起组成了DDTN。通过内嵌扩张卷积操作的层级稠密网络模块的堆叠,DDTN可以有效地对时序行为检测任务中视频中长时序依赖和信息多尺度建模,很大程度上克服了时序行为检测问题的困难点。实验表明,在目前基于深度学习的时序行为检测两大解决方案中(基于细粒度帧级检测以及基于时序提议和分类回归的检测),DDTN均带来模型效果的提升。

其他文献

论兴趣分组对转变体育差生的作用

【摘要】随着我国新世纪的不断推进，各种具有创意性的教学思想与教学方式应运而生。而在教学改革的素质教育发展的同时，兴趣分组教学也得到了广泛的关注与好评。兴趣分组的教学方式，简单来讲就是以兴趣作为划分小组的一种教学活动方式。在体育教学过程中，对于差生的教学方式应该以学生的兴趣为基础加以鼓励和引导，帮助学生对于这一方面的学习产生兴趣后，才会进一步的激发学生的求知欲望。本文便结合实际的教学情况，进一步的探

期刊

兴趣分组体育差生定义应用作用或意义

学前社会教育课堂教学策略的优化

【摘要】随着社会和教育的发展，我国家长们对于学前教育给予了更高的关注，现阶段学前教学课程体系也日益完善，不仅涉及到基础的文化课程、艺术课程同时也涉及到社会教育的课程，旨在为幼儿的成长和学习营造全方位的学习环境，笔者以此为研究背景，客观论述现阶段我国针对学前社会教育的理解，对于主要的教学方法以及教学现状深入分析，针对所存在的不足，提出具有前瞻性和科学性的教学策略，以此为学前社会教育课堂教学的优化提供

期刊

学前教学社会教育教学现状教学策略

防腐抗氧化品质自主保持发酵火腿的研究

本文以从牛干巴中分离出来的具有抗氧化作用的希腊魏斯氏菌（B13）和从鸭肉中分离出来的具有防腐作用的清酒乳杆菌（Y19）以及从泡菜中分离出来的戊糖片球菌（Pp）作为混合发酵剂,以猪的

学位

发酵火腿混合发酵剂加工工艺理化性质预测模型

基于稠密扩张卷积网络的时序行为检测

其他学术论文