基于卷积神经网络的人体行为检测研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:kantstop
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着高清视频监控的推出,使得基于人体行为检测技术的智能监控系统在智慧城市、军事安防和智能家居等领域快速发展。同时随着智能终端的普及和移动通信网络的发展,使得大量短视频快速涌现,这急需对视频内容进行理解,以便更好地检索、分类和审核视频,而视频的主体就是人体行为。巨大的应用前景和经济价值让人体行为检测迅速成为计算机视觉领域的研究热点。传统的人体行为检测算法需要根据特定动作设计特征工程,工作量巨大且鲁棒性不高。本文利用卷积神经网络(Convolutional Neural Network,CNN),针对中短视频和未剪切长视频分别设计具体的网络结构,提高算法的鲁棒性、准确率和实用性。对于中短视频,借鉴物体检测算法,提出物体检测加动态连接的人体行为检测方法。为了提高检测准确率,使用连续帧作为输入提取视频的时序信息,同时采用时空特征融合算法,得到更加鲁棒的特征。然后设计有效的动态连接算法,从物体检测的结果中得到人体行为序列。最后在多个行为检测数据集上进行网络训练、验证并与前人的研究工作进行对比。实验验证了物体检测加动态连接算法的有效性,同时连续帧输入和时空特征融合进一步提高了准确率。对于未剪切长视频,提出三维卷积配合循环神经网络(Recurrent Neural Network,RNN)的网络结构。首先使用三维卷积对视频进行低等级特征编码,然后设计循环记忆模块进一步提取时序特征,最后通过检测部分实现行为检测。在循环记忆部分设计两个并行的语义约束模块P(Proposal)和C(Classification),通过精细化的损失函数设计,分别实现候选视频段提议和分类任务。在训练时动态调整语义约束部分损失函数的权重,加快训练速度,提高准确率。实验表明,相比于前人的研究,准确率提升明显,这说明本文提出方案的有效性,也让人体行为检测向实用性又迈进了一步。
其他文献
管理起源于人类的共同劳动。在共同劳动中,出现了劳动的分工和相互协作,进而逐渐产生了管理的需要。原始社会是人类社会的最初阶段,原始人类在社会活动中创造了灿烂的文化,同
汉语隐语是汉语词汇系统的组成部分,也是汉民族共同语的词汇来源之一。对汉语隐语进行研究不仅有助于我们认识其隐秘性的本质特征,而且有助于我们认识其词汇结构与造词规律。本
从捐赠决策驱动、捐赠结构、捐赠效果三方面论述了中外企业捐赠模式的差异;分析了存在这种差异的原因;并在此基础上提出了转变我国企业慈善捐赠模式,培育现代公司慈善文化的
改革开放以来,我国的经济得到了快速发展,而作为经济发展重要基础的石油行业也迅速崛起。石油产业的基础在于石油钻井生产,而就目前的情况来看,石油钻井生产存在诸多的安全隐
随着知识经济的发展,社会对人才的职业素质要求越来越高。医学生是我国医疗卫生事业的后备人才,加强医学生的职业人格培养,提高医学生的职业素质,对更好地保护人民健康起着重
探讨促进我国器官移植进一步加快发展的途径 ,通过对我国器官移植现状以及所面临问题的分析 ,阐述了人们的传统文化背景、思想观念及伦理道德观是影响我国器官移植发展的因素
背景:卵巢癌(Oarian cancer)是世界上最常见的女性生殖系统恶性肿瘤之一。由于早期的卵巢癌患者症状并不明显,而且缺乏有效的早期诊断方法和治疗策略,当患者就医时一般已经发展到
多数喜欢动画片的人们可能没有注意到,2000年,国家广播电视总局曾出台一项政策,规定国内省级电视台每天必须播出不少于30分钟的动画节目,级别更低的电视台每天必须播出不少
近几年来,台湾地区的机构知识库建设呈现了蓬勃发展的势头,形成了自己的先进理念和成熟经验,并呈现出如下特点:建设主体类型多样、建设内容广泛并注重特色、联盟协作并强调区
对Ad Hoc网络中两种典型的按需路由协议AODV和DSR协议进行了介绍,对两种协议的路由发现和路由维护过程进行了分析与比较。对两种路由协议在不同的运动场景中进行了比较系统的