私家车轨迹数据的时空属性挖掘关键技术研究

来源 :湖南大学 | 被引量 : 4次 | 上传用户:xy255c
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国经济社会的快速发展和城镇化进程的快速推进,交通基础设施得到了大的改善。私家车成为人民对美好生活的交通需要,市民驾驶私家车出行已成为重要的出行方式。同时,随着网络的普及和通信技术的快速发展,各种车载智能传感设备普遍应用,如:智能车机、云后视镜、OBD盒子等等。通过这些智能传感设备,可获取大量的车辆移动轨迹等时空数据,为感知市民的出行信息成为了可能。在大数据时代,开展私家车轨迹数据相关研究,深入挖掘轨迹数据具有很高的经济价值,对政府和交通管理部门科学决策智慧交通建设都具有重要意义。
  然而,在轨迹数据挖掘中,由于轨迹数据的时空序列性、稀疏性、噪声干扰和蕴含深层次的时空属性等特点。轨迹数据挖掘与传统数据挖掘具有诸多不同,有许多技术难题需要开展研究,如:数据不平衡、数据稀疏性等问题。针对目前轨迹数据挖掘中亟待解决在技术难点。本文分别从轨迹数据压缩、时空属性挖掘、用户移动行为的时长预测和空间预测等四个方面展开研究。本研究贯穿了轨迹数据处理、轨迹数据挖掘和智能预测等过程,重点分析了轨迹压缩技术、轨迹挖掘技术和行为预测技术。本文的主要工作概括如下:
  (1)针对在信息技术飞速发展的时代,海量轨迹数据带来了巨大的传输和存储开销问题,以及诸多基于位置的应用服务对高采样率和实时采集的轨迹数据的需求。提出了一种面向大规模私家车轨迹收集过程的机会压缩方法(OCT-LSTM)。通过预测模型学习和利用车辆轨迹数据中蕴含的时空属性,以预测值替代传输过程的策略,实现车辆轨迹数据传输过程中的压缩。具体而言,首先通过时空变化方法,将轨迹数据简化成空间路径和时间距离序列两个部分,并分别进行压缩。对于空间路径数据采用字典压缩方式;对于时间距离序列,通过训练基于长短期记忆网络的预测模型,来记忆和学习在历史数据中出现的运动模式,并对此进行预测。利用OCT-LSTM方法可以显著降低轨迹数据的传输开销(在压缩误差小于25的情况下实现了约127.3倍的压缩比),且可以实现低时延的轨迹压缩处理(运算时延约1.81秒),有益于实现低成本高采样率的车辆轨迹数据实时传输。
  (2)面对私家车轨迹数据中蕴含深层次时空信息(如:空间相似性、多尺度移动和时间周期性等等),设计了基于私家车轨迹数据的用户出行行为挖掘方法。首先,提出了一种基于滑动窗口的车辆状态在线检测方法,可以从实时采集的轨迹数据中即时检测出车辆的状态,将抽象的私家车用户轨迹数据转化为对有价值的移动行为数据;然后,挖掘了私家车用户移动行为数据的空间属性,提出了一种用户聚集效应的密度聚类方法,并分析了用户移动行为在空间层面的分布特点和多尺度移动属性;最后,挖掘了用户移动行为数据的时间属性,并给出了一种用户出行行为时空差异性的度量方法。
  (3)停留时间是理解用户停留行为和出行动机的重要指标之一,但用户的行为受多因素影响和具有随机性的特性,如何有效利用轨迹数据预测用户的停留行为时长仍然是一个有挑战的问题。对此,本文研究了一种面向私家车用户停留行为的时长预测方法(STP)。在数据驱动的智能模型构建方面,设计了一种密度聚类和核密度估计的时空特征提取方法,针对性的利用了私家车用户的停留行为数据的空间相似性、时间周期性和时空相关的特性。并结合基于梯度提升回归树的用户停留行为时长预测模型,并通过大规模真实私家车轨迹数据验证了实验方法,STP方法能达到RMSE值约123.94(R2值约0.893)的预测效果。
  (4)深入理解用户移动行为,准确预测用户未来的出行目的地,已成实现与位置相关的智能化服务的重要基础条件。利用用户出行行为的探索性和时空依赖性,本文进一步探索了对私家车用户出行行为的位置预测方法(TBP)。分析了用户出行行为中的探索出行行为(访问新地点),通过挖掘出行行为的距离、方向和时间规律属性,设计了一种对私家车用户探索出行行为的预测方法(TBP-E),可以预测用户的出行目的地是否是从未访问过的新地点。进一步,通过挖掘用户出行目的地的时空关联属性,研究了用户出行的时空引力模型,并提出了一种私家车用户出行行为的地点预测方法(TBP-L),可以实现对用户出行目的地的有效预测。
其他文献
影像组学是一种基于高性能计算机和算法从海量的计算机断层图像(Computed Tomography, CT)、磁共振图像(Magnetic Resonance Imaging, MRI)及正电子发射/断层图像(Positron Emission Computed Tomography, PET/CT)等多模态医学影像数据中提取感兴趣特征并进行处理分析的技术,该技术能够为疾病的早期诊断、良恶性肿瘤鉴
DNA拓扑异构酶Ⅱ(TOP2)作为一种复杂的分子机器,它在RNA的转录、DNA的复制以及染色体的压缩和解凝等细胞基础活动中通过短暂的剪切双链DNA并在原位重新连接断端的方式,松弛、解螺旋DNA双链来调整DNA的拓扑结构,是细胞生长存活必不可少的酶类。针对TOP2的这一特性已开发出了多种干扰细胞增殖的药物,比如临床上广泛使用的TOP2靶向化疗药物替尼泊苷(VM-26)、依托泊苷(VP-16)和阿霉素
学位
先天性免疫反应是宿主细胞应对外源刺激物和病原菌入侵的第一道防线,这种特异性反应依赖于广泛分布在细胞膜和细胞质的模式识别受体(Pattern Recognize Receptors,PRRs)。目前已发现的模式识别受体主要包括Toll样受体(Toll-like receptors)、NOD样受体(NOD-like receptors)、RIG样受体(RIG-like receptors)。PRRs识
氮氧化物(NOx)是燃煤电站锅炉排放的最主要的污染物之一。NOX进入大气后会直接造成对人体的危害,同时还是酸雨的主要来源。我国正逐步加大对火力发电锅炉排放NOx的控制和治理力度。分级燃烧是减少NOx排放的主要手段之一。其基本原理是:将约75-85%的总空气量送入主燃烧区与全部燃料混合燃烧,形成燃料过剩燃烧区,此处由于氧气含量少,同时燃烧温度也降低,因此减少了NOx的生成。剩余的空气在主燃烧区外投入
学位
容易产生不可控裂纹是CO2激光切割玻璃的主要问题。因此研究新的玻璃切割方法具有重要的理论意义与工程价值。本文对激光切割平板玻璃进行传热和应力数值模拟,研究激光切割过程中裂纹形成的机理、分析减少裂纹的措施。本文主要工作如下:(1)建立了激光切割玻璃的一维传热数学模型,建立了工件的切割曲线方程,通过求解切割曲线方程得到了激光切割玻璃的极限速度与激光功率的关联式,将理论分析结果与现有实验结果进行对比,证
学位
近年来,随着科学技术的飞速发展,网络系统不断朝着向大规模、高复杂和高度智能化方向发展,系统的组成单元也从只具备单一功能的受控对象进一步转化成集成具有一定传感、通信、计算、执行能力的智能体。网络系统领域的这些变革和发展,最终发展形成了现在的复杂系统理论。受此影响,多智能体系统理论就此应运而生并成为解决复杂系统问题中一类重要的理论。由于在面对动态的以及开放环境中的优化问题,传统的集中式处理方法已经无法
近些年,由于多智能体系统的分布式协调控制在无人机编队控制、人造卫星姿态控制、多机器人群集控制等工业和军事领域中具有广阔的应用前景,使其得到了越来越多学者的密切关注。多智能体系统的一致性问题是智能体间分布式协调合作的关键,吸引了计算机科学、控制工程等领域专家学者的浓厚兴趣。同时,在控制工程领域,脉冲控制因其具有控制量小、收敛性能高、控制成本低等优点,已经在复杂网络的研究中广泛运用。多智能体系统作为一
近年来,无人机在军事领域和民用领域的应用越来越广,特别是四旋翼无人机,由于结构简单以及飞行方式灵活,成为了无人机领域的一个研究热点。然而,四旋翼无人机是一种典型的欠驱动系统,并且具有强非线性和强耦合的特点,同时易受外界风扰的影响,因此对四旋翼无人机进行精确地建模十分困难。本文以四旋翼无人机为研究平台,开展了基于LADRC的四旋翼无人机飞行控制研究。论文的主要工作和创新点如下:  (1)首先考虑动力
学位
随着科学技术的发展,工程控制系统的规模和复杂性不断增加,出现故障的机率也随之增大。任何类型故障的发生都可能导致整个系统性能下降,甚至影响系统稳定性,造成不可预期的损失。因此,提高控制系统的安全性和可靠性变得尤为重要,容错控制的出现和发展为解决这一问题提供了有效途径。考虑到实际工程系统几乎都是非线性系统,因此研究非线性系统的容错控制问题非常有意义。由于非线性系统本身的复杂性,其控制理论的发展并不完善
云计算已经被广泛应用于各个领域,然而随着物联网技术的发展,云计算面临着很多问题亟需解决。由于造价(建设成本)昂贵,云计算不能实现大范围部署,不能及时处理物联网大量终端设备的数据,无法满足物联网中延迟敏感和位置感知的应用需求。Cisco预测全球连接设备的数量在2020年将达到500亿,随着物联网设备的快速增加,海量数据将被传输到数据中心进行处理,2020年底,全球数据中心每年的IP流量将达到15.3
学位