基于深度卷积神经网络的人体行为识别研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:cynthia0737
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别是当前计算机视觉领域的一个重要研究分支,通常分为个体行为识别与群组行为识别两个任务。个体与群组行为识别在研究上基于相似的理论,而在方法上有所不同,且具有各自的局限性。当前已有的个体行为识别方法需要大规模数据集预训练支撑,学习成本高,且无法充分利用输入数据中的时间信息。而已有的群组行为识别方法在群组中个体之间的关联信息的挖掘方面不够充分。本文在总结了行为识别方法的基础上,针对两种行为识别任务,主要解决了行为识别中的以下几个问题:第一,对于个体行为识别,如何有效利用时间信息提升识别性能,是个体任务中一个重要的问题;第二,群组中个体之间是有关联的,对群组中个体间的关系进行分析也是群组行为识别中一个关键的问题。针对这些问题,本文做出以下工作:(1)针对目前主流网络需要大型数据集预训练以及无法有效利用跨时间信息的问题,提出了基于双流卷积网络与膨胀3D卷积网络的深度神经网络模型。并重新设计网络结构,命名为多流3D融合网络。首先,利用改进的双流网络与膨胀3D网络提取人物动作特征。再利用分段长短期记忆网络提取时间特征。最后利用残差连接方法融合特征,得到最终的个体识别结果,实现了精确的个体行为识别。(2)针对目前群组行为识别方法没有充分利用群组关联信息而导致群组识别精度无法有效提升的问题,提出了基于近邻传播聚类的层次关联模块的深度神经网络模型,命名为聚类关联网络。首先,利用卷积神经网络提取场景特征,再利用区域特征聚集提取场景中的人物特征。然后,利用近邻传播聚类的层次关联网络模块提取群组关联信息。最后,利用长短期记忆网络融合个体特征序列与群组关联信息,并得到最终的群组识别结果。聚类关联网络属于有监督学习,可实现端到端训练。在Collective和Volleyball数据集上的实验结果表明该方法相比其他前沿方法具有更高的识别精度。
其他文献
目的:多种受体酪氨酸激酶蛋白在恶性肿瘤的发生发展过程中起重要作用。其中,EGFR在头颈鳞癌中广泛表达,是其最重要的治疗靶点。我们前期课题研究发现RET在口腔鳞癌组织中高表
本文以GF(2)上的n级m-序列为基础,根据改进自缩生成器模型,提出新型自缩控生成器模型,该模型利用相邻比特的模加值来控制具体比特的输出.设序列α∞为GF(2)上的n级m-序列,把
画面结构内含非常复杂,画面结构自古希腊时期一直延伸至普桑、塞尚,并且影响了20世纪的现代艺术。画面结构不单是作者客观再现的技法,同时也是作者平衡画面节奏的体现。除了
森林冠层图像可以反映森林生态系统中植物种群生长的各种参数,这些参数可作为生态学模型、全球生态系统变化模型的输入量,对生态系统健康状态和生产力水平、全球气候变化研究
群智能优化算法是受自然界中群居生物生活习性的启发而提出,用于解决复杂优化问题的算法,目前已成为解决优化问题的研究热点。人工蜂群算法(Artificial Bee Colony algorithm
信息科技的迅速发展让这个世界日新月异,人类智慧的结晶渗透于生产生活的方方面面,而各类光电信息设备也正一步步趋向于一体化,微型化,集成化。对于光学器件而言,从原先的庞
物理概念是学习者进入物理世界的第一道风景线,然而物理概念数量和种类均众多,访谈中,中学一线教育者普遍认为物理概念教育者难教学习者难学。目前概念教学中有一个较普遍的现状:教育者重练习不重概念形成,学习者多背、记、做少理解,故构建良好的情境帮助学习者建立准确的物理概念成为概念教学之关键。比值定义类概念占中学学段物理概念很大一部分,其用来定义新物理概念的“比值”往往蕴涵着比例、比率、变化率、流量、疏密度
学位
图像补全模型的研究有利于帮助人们更加便捷地对图像进行复原或修饰。目前图像补全方法的研究以基于深度学习的模型最为常用,效果也更为优秀,但是由于图像缺失种类的多样性,
随着农机自动化、智能化的发展,人工喷药作业逐渐被智能农机所代替。智能喷雾机作业效率高,可广泛应用于农业领域植保防治,是数字农业领域重点研究方向之一。目前农业领域中,
目的分析中国人唾液腺乳腺样分泌癌(mammary analogue secretory carcinoma,MASC)的临床病理、免疫组织化学、分子遗传学特点及非MASC中乳腺球蛋白(mammaglobin)表达,对MASC