基于位置约束的时空轨迹ID修复问题研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:inc9649
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,很多监控应用会在固定位置设置一些捕获设备对运动实体进行追踪,从而产生大量时空轨迹数据。例如在交通管控系统中,安装在道路上的智能摄像头会自动拍摄并对过往车辆进行识别。在这个过程中,对实体ID(如:车牌)的检测往往是很重要的一个环节。然而有时候,由于光照不足或遮挡等各种原因,实体ID可能会被识别错,继而导致后续计算出现误差甚至失败。  考虑到很多情况下,实体的移动会受制于现实场景中与位置关联的一些约束,(如:车辆必须在已有道路上行使)。本文尝试利用相关位置约束对时空轨迹中的错误ID进行检测和修复。通常,此类约束会对实体的运动轨迹模式有所要求,而ID错误将导致实体原有轨迹断裂成多个违反约束的片段,本文将据此实现错误检测。进一步考虑到违反约束的成因,本文还将关注如何通过ID重写和轨迹片段合并,来逆向消除违反位置约束的轨迹片段,从而达到修复错误ID的目的。但事实上,即便违反约束,也无法断定某个ID一定错误,且对于每个错误可能都有多种候选的ID重写及轨迹片段合并方案,因此该问题实际解决起来非常困难。为了更好地应对不同场景下的数据特征,本文针对批量离线处理和流式在线处理两种模式分别设计出相应的解决方案。  在传统的离线处理情况下,本文提出一种名为转移图的位置约束,利用它实现错误ID的检测和修复。由于数据集固定且支持随机访问,该模式下可以利用一个全局优化问题来形式化描述轨迹ID修复过程。为了解决该问题,文章给出了一个包含生成候选修复和选择候选修复的两阶段范式,通过最大化一个有效函数来引导ID修复。虽然在实现两阶段范式的过程中会遇到复杂度非常高的问题,但本文充分利用时空轨迹数据中的本地性和稀疏性特征,提出了高效的修复算法。为了进一步提高修复方法的效率,本文还通过一个索引结构和一个剪枝策略对算法核心步骤进行了优化,随后通过在真实和人工数据集上的大量实验,证明了所提出方法的有效性和高效性。  另一方面,一些在线系统常常会将轨迹数据应用于大量时间敏感的查询或处理任务中,因此有必要对持续生成的轨迹记录流进行实时ID修复。由于流处理具有一过性和只支持顺序访问等特征,因而很难像批处理一样对整体数据实施全局优化。考虑到移动实体会被不断追踪,因而在一段时间内,如果某些ID仅出现过一次,那么它们是错误ID的概率会很高。据此,本文利用另一种形式的位置约束——有效位置序列,对此类呈现单值特性的特殊ID错误进行修复。为了支持该过程,文中提出了一种名为追踪树的数据结构,它可以实时对不同的候选修复项进行全量索引,并能够在判定ID错误后辅助快速选择一个最优修复方案。本文还进一步介绍了如何在Apache Storm上实现一个分布式的在线ID修复系统,并通过相关实验验证了系统的性能及效果。  本文从批处理和流处理两个角度对时空轨迹中基于位置约束的ID修复问题进行了深入研究,文章的主要贡献可概括如下:  (1)本文首次定义了时空轨迹中利用转移图约束对ID进行修复的问题,并提出了一个两阶段修复范式以及相应算法。  (2)基于上述方法,本文又提出一个索引结构和一个剪枝策略用以提高ID修复的效率,随后通过在真实和人工数据集上的大量实验,证明了所提出方法的有效性和高效性。  (3)对于流式在线计算场景,本文介绍了利用位置序列约束对单值ID进行修复的问题,并提出一个追踪树索引结构和一个基于Apache Storm的分布式在线ID修复系统。通过在真实和人工数据集上的实验,证明了所提出的方法具有良好的效果及可伸缩性。
其他文献
多智能体网络的一致性与稳定性是复杂系统的两种主要动力学行为,同时也是复杂系统协调控制的前提与根本性问题。随着多智能体网络的一致性问题在诸如无人机、无人驾驶车辆、大
本文在介绍嵌入式系统软硬件相关技术的基础上,重点论述了开放源代码的嵌入式实时操作系统 uC/OS-II基于 ARM微处理器的移植与实现设计。笔者首先分析了uC/OS-II的源代码,对
数据挖掘的基本含义就是从海量、不完全、有噪音的数据中获取对用户来说有直接或间接价值的信息。聚类分析的显著特征就是不需要任何先验知识或信息,只是根据事物之间的某些
万有引力搜索算法(Gravitational Search Algorithm, GSA)是由伊朗克曼大学的Esmat Rashedi等人于2009年所提出的一种新的启发式优化算法,其源于对物理学中的万有引力进行模
无线传感器网络(Wireless Sensor Network, WSN)技术作为21世纪具有巨大影响力的技术之一,已经成为当今世界前沿科技的研究热点,ZigBee作为设计WSN的主流协议,也同样备受关注
随着智能手机的不断普及与手机上网用户的持续增多,个人手机安全问题越来越多的得到了关注。Android平台作为近几年来新兴的手机操作系统,市场占有率达到智能手机的一半以上
运动目标的跟踪与识别作为计算机视觉的一个核心研究课题,相关算法如雨后春笋般出现。跟踪的目标及场景的差异,导致跟踪算法的选择也不尽相同的,这就需要在算法设计阶段能够
图像分类在计算机视觉研究领域中是一个热点问题,一直以来备受学者关注,尤其是近些年来,数字图像的规模呈现爆炸式增长态势,图像分类已成为许多领域的一项关键任务,因此其研
WLAN已经成为国内三大运营商的建网重点,运营商对WLAN网络的建设已经从初期的建设期发展为建设与运营并行考虑的时期,既要考虑如何在扩建、提速下有效维护、优化WLAN网络,实
离群点是指数据集中和常规数据对象的产生机制完全不同的,不符合数据的一般规律,偏离常规数据对象的数据点,但是它们又可能包含着我们容易忽略的非常重要的信息。如在信用卡