基于多流架构与长短时记忆网络的组群行为识别方法研究

来源 :青岛科技大学 | 被引量 : 1次 | 上传用户:liongliong602
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频中的组群行为识别是一项具有挑战性的任务,现已成为计算机视觉领域的研究热点。组群行为相比于单人行为具有更复杂的结构,组群内部之间的干扰、遮挡以及人与人之间的交互关系等都会对我们最终的识别结果产生影响,因此,并不能直接将单人行为识别技术应用于组群行为识别任务中。目前,在组群行为识别方面主要面临两个难点,一是如何利用复杂场景中的多重视觉线索进行信息融合,以获得更具区分性的特征;二是如何对群体中的情景人物进行建模,以获得视频中的长时序上下文关系。然而,以前的大多数方法都无法提供一个实际的解决方案来共同解决这两个问题。因此,本文提出一种基于双路TSN网络(Temporal Segment Networks)架构与LSTM网络(Long Short-Term Memory Networks)的上下文建模框架,同时解决这两个问题。对于前者,利用视频中的多重视觉线索,不仅考虑外观特征,还将运动特征考虑在内,为捕获视频中人物及场景的光流信息,本文采用双流卷积神经网络TSN网络来处理该问题,并将该框架扩展到处理集体行为识别问题上。受基于传统的全局与局部特征融合方法的启发,本文在关注局部信息的同时,更加关注全局特征的有效性。为了正确理解组群行为,本文在单人行为识别技术的基础上,消除无关人物对我们识别造成的干扰,提取主要人物及场景的外观信息;为了解决视频中人与人之间存在的遮挡问题,将主要人物及整幅图片的运动信息也考虑在内。利用两路TSN网络进行特征提取,一路局部TSN网络提取局部特征表示,一路全局TSN网络提取全局特征表示,然后融合局部与全局的外观和运动特征,获得更具区分性的特征。对于后者,则是在TSN信息融合的基础上,借助于时序采样,通过LSTM网络,捕获视频中的长期时序依赖关系,生成用于组群行为识别的上下文综合特征表示。然后将两路softmax层的分类结果进行融合,从而实现组群行为识别。最后,将本文所提算法在CAD1和CAD2两个组群行为数据集上进行了验证与分析,分别取得93.2%和95.7%平均识别率。相比于基于传统的组群行为识别方法,本文所提模型有了很大提高;相比于目前主流的组群行为识别方法,本文模型也表现出了较好的性能,证明了本文算法的有效性与稳定性。
其他文献
网络Voronoi图模型是一种有效地划分空间影响范围方法,基于网络最短路径时间分析的Voronoi图可以反映实际的设施服务需求之间传递方向和关联关系。鉴于相邻发生元引力势能平
现如今,随着能源需求增加和环境资源浪费等挑战,分布式发电(DG)逐渐进入到现代配电系统中。微电网作为一种小型低压供电网络,如今被广泛应用,其至少包含一种分布式发电。若微电
虚弱症是由人在躯体功能、心理精神、社会保障等方面存在的缺陷,导致身体多系统结构、多器官组织储备功能下降到接近阈值时的一种状态或一组综合征。虚弱症具有高并发和高风
节能服务产业已经在我国发展二十余年,其间节能服务产业经历了初期引进阶段、全面推广阶段、稳定发展阶段,到今天进入了转型升级的阶段,受外部环境的压力和企业自身能力的限
近年来ARM安卓已成为市场占有率最高的移动智能终端平台。各类安卓应用层出不穷的同时,应用的规模和复杂程度不断提高。安卓移动终端的交互方式和硬件特性决定了应用必须要充
近些年,我国经济社会实现了跨越式的发展,城市化水平得到了迅速的提高,标志着我国城市化发展开始迈入新的时期,与此同时,城市的高速发展,完善的现代化交通运输体系也随之形成
随着人工智能的发展,液压挖掘机的智能化也在快速发展,这会很大程度地提高了挖掘机的工作效率并且降低了劳动强度和劳动成本,挖掘机还可以平稳高效的完成许多危险动作并且在
当今,塑料制品是现代高科技发展所需的重要新型材料之一,被广泛应用于信息、能源、农业、工业、交通运输乃至航空航天和海洋开发等国民经济各重要领域。然而,吹瓶机作为塑料
六方氮化硼(hBN),是一种人工合成的超宽禁带半导体材料,具有类石墨结构,俗称“白石墨”。其禁带宽度高达6.0 eV以上,本征吸收边约为207 nm,在吸收边附近的吸收系数高达7×105 c
利用湿法烟气脱硫系统协同脱除燃煤烟气中的汞污染物被认为是具有发展潜力的脱汞技术之一。湿法脱硫系统在脱除燃煤烟气中的SO2的同时,能有效的去除烟气中的二价汞(Hg2+),但