基于视觉的跨场景集群行为理解

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:landywww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球城市化进程的深入,城市人口愈发密集,大型活动及大型事件的发生也愈发频繁。若集群行为管理不善,往往会造成大型活动的混乱甚至灾难。集群行为理解因其在智能视频监控、公共空间管理、城市公共安全等领域的需求,受到了社会学、心理学及生物科学等学科的广泛关注与研究。本文的研究内容主要是基于视频数据,以计算机视觉和机器学习的研究领域角度,研究并理解集群行为,具体包括集群分割、集群行为属性估计、集群计数估计、集群行为类型识别等问题。影响集群行为理解算法的关键技术环节主要包括大型数据集的支撑、具有任务针对性的集群特征设计、集群统计模型的设计和开发。围绕以上关键技术环节,本文开展了相关研究并取得了一定的创新成果。首先本文建立并公开了WorldExpo’10大尺度跨场景集群行为理解数据集,此数据集是目前公开的最大真实集群场景视频数据集。数据采集于2010年上海世博会的真实监控视频数据,通过数据脱敏处理,以达到数据集公开标准。WorldExpo’10数据集包含两个部分,跨场景集群行为属性数据集和跨场景集群计数数据集。针对不同的集群行为理解问题,数据集提供了标注工具并进行了详尽的标注。跨场景集群行为属性数据集包含了四种不同的集群属性估计任务,包括集群分割、集群密度估计、集群一致性估计与集群粘聚力估计。跨场景集群计数数据集则是针对集群计数问题进行了构建。WorldExpo’10数据集发表以来,受到广泛地关注,总下载次数超过1000次,下载地区横跨全球,包括数十个科研单位,广泛用于集群行为理解、集群计数等算法研究的开发和验证评估。为了有效解决WorldExpo’10数据集中通用跨场景集群行为理解的挑战,本文提出了基于多尺度时空相似性的集群行为属性估计算法。为了进一步有效描述集群场景特性以及集群行为特性,本文设计了两种集群特征,全局集群特征和局部集群特征。全局集群特征用于表征集群场景信息,基于全局集群特征可以匹配与待检测样本相似的场景。局部集群特征用于表征具体局部的集群行为时空特性,用于匹配与待检测样本最相似的局部集群数据,采用相关反馈算法调整集群局部特征的参数,使其更适合描述集群特性。基于多尺度时空相似性,通过标签转移方法同时对四种不同的集群属性进行估计。通过实验验证,在集群分割、集群密度估计、集群一致性估计与集群粘聚力估计四项任务中,该方法都可以有效地得到属性估计结果,性能优于其他算法。针对每项特定属性估计都专门设计相对的对比算法,而本算法可以在同一种计算框架下,同时完成四种属性估计任务。针对跨场景下集群计数这个集群行为理解的具体问题,本文率先提出了通过集群卷积神经网络模型,实现跨场景集群计数,所发表的学术成果受到了广泛的关注,更多的学术工作聚焦于基于深度模型的跨场景集群计数问题,使其成为了计算机视觉领域的研究热点之一。本文提出的跨场景集群计数算法,针对任何目标场景,无需进行额外标注,即可实现该场景下的集群计数任务。同时本文又提出了一种目标可切换的训练方式,将集群计数问题,转化成集群密度分布估计与集群全局计数两个问题,通过针对这两个目标任务的交替训练,增强了集群卷积神经网络的表达能力。为了使模型更好地适用于新的测试场景,本文还提出了一种基于数据驱动的模型微调算法。通过检索与测试场景相似的数据,微调(fine-tune)集群卷积神经网络模型,可以实现更准确的跨场景集群计数。通过实验验证,多任务集群卷积神经网络算法可以实现跨场景集群的技术目标,无论在多场景还是单一场景实验环境中都优于其他已发表算法。最后本文研究了结构化分组群的集群行为识别及分析,其研究思路主要是将集群场景抽象为一个包含由多个组群概念的分层结构。本文提出了两种集群行为识别算法,基于多组群局部因果性特征的集群行为识别算法和基于可变结构的多层次图模型的集群行为识别算法。基于多组群局部因果性特征的集群行为识别算法设计了一组集群因果性特征,通过因果性滤波器的响应值,描述个体、组群和集群之间的相互影响关系。通过局部化约束系数编码方式,对集群因果性特征进行编码。然而此算法的分组方式,仅考虑了位置信息,并没有在分组时考虑到个体之间的运动信息,也无法适应人数、组群数量变化性更强的集群行为样本。所以本文进而提出了基于可变结构的多层次图模型的集群行为识别算法,将集群行为抽象为一个具有隐变量的多层图模型。通过隐条件随机场模型识别集群行为类型,同时判断组群和个体的行为以及集群内的分组关系。本文针对此结构化模型设计了一种推断方法,并提出一种基于采样的启发式搜索算法实现对集群内个体更合理分组关系的推断。实验结果表明,引入组群概念并分析组群之间的相互影响可以有效地提高集群行为识别算法的准确率,相比已发表的其他算法有明显的提高。同时因为第二种算法对集群中的分组关系进行了更有效的推断,相比第一种算法和其他对比算法,集群行为识别准确率进一步提高。
其他文献
基于MiLE算法对大规格钛扁锭凝固过程进行非稳态模拟,研究了大规格钛锭的横截面尺寸、浇注温度和拉锭速度对其固、液界面形貌、液相区深度以及过渡区长度变化旳影响。结果表
建立并实施渔业捕捞准入制度是社会主义市场经济下政府监管渔业的有效手段之一。本文针对近年来我国渔业界呼声很高的渔业捕捞准入制度,从社会主义市场经济的视角辨析,指出当
六、利用鳗鳖空池精养澳洲淡水龙虾 目前由于鳗鳖受到市场价格的冲击,许多地方鳗鳖池子放空甚多,利用这些空池养殖淡水龙虾可以使这些池子得到充分利用。鳗鳖池原来的一整套
本文从社会分工细化对行业经营模式选择的影响角度出发,以旅行社为例探析社会分工细化如何实现行业利益的增加,从而实现社会效益提高的过程,以此对社会分工与经营模式提出进
量子通信在原理上被证明了是一种安全的密钥分发方式。海洋占地球面积71%,环境与大陆迥异,几乎没有通信基础设施依托。拓展量子/激光通信的覆盖区域,构建覆盖全球的天地一体
农作物病害实时诊断和施药防治,对大田作物优质高产具有重要意义。农作物冠层热红外图像可以表征其生殖生长信息,较传统单点测定技术具有尺度上的优势,是实时检测植株早期病害的重要途径之一。目前应用农作物冠层热红外图像处理技术,构建难以用精确数学模型描述的农作物病害快速识别方法,已成为智慧农业研究的热点和难点问题。本研究以农作物冠层双源图像为研究对象,深度融合植物病理学知识与智能信息处理技术,提取了冠层可见
采用3种不同方法对干热处理后的脱脂豆粕进行处理,再加入Ellman’s试剂来测定脱脂豆粕中的巯基含量。通过理论和数据分析得到,方法二即脱脂豆粕、尿素-SDS溶液和Ellman’s试
随着人们对燃气轮机性能需求的不断提升,对涡轮气动性能优化设计也有着更高的期望。涡轮做功过程中,由于动叶的高速旋转决定了其本身的运动性质必定是高度非定常的,动静干涉
随着社会经济的发展,人民生活水平的提高,人们越来越关注自己的生活质量和健康状况,逐渐认识到锻炼的必要性,开始进行各种形式的健身运动,逐渐改变过去单一、无聊、被动的锻
作为我国唯一的全天候战略伙伴,巴基斯坦在我国“一带一路”倡议中占据举足轻重的地位,“中巴经济走廊”是“一带一路”建设中的旗舰项目。然而,巴基斯坦地区的恐怖主义、贩运毒品、跨国犯罪等非传统安全问题日益严重,对走廊项目建设以及中巴两国公民的人员安全造成严重威胁。中巴双方为此开展了执法安全合作,取得了一定成效,但仍存在不少问题,无法有效应对日益猖獗的非传统安全威胁。为了地区稳定和发展“一带一路”的需要,