论文部分内容阅读
随着中国经济社会的快速发展和城镇化进程的快速推进,交通基础设施得到了大的改善。私家车成为人民对美好生活的交通需要,市民驾驶私家车出行已成为重要的出行方式。同时,随着网络的普及和通信技术的快速发展,各种车载智能传感设备普遍应用,如:智能车机、云后视镜、OBD盒子等等。通过这些智能传感设备,可获取大量的车辆移动轨迹等时空数据,为感知市民的出行信息成为了可能。在大数据时代,开展私家车轨迹数据相关研究,深入挖掘轨迹数据具有很高的经济价值,对政府和交通管理部门科学决策智慧交通建设都具有重要意义。
然而,在轨迹数据挖掘中,由于轨迹数据的时空序列性、稀疏性、噪声干扰和蕴含深层次的时空属性等特点。轨迹数据挖掘与传统数据挖掘具有诸多不同,有许多技术难题需要开展研究,如:数据不平衡、数据稀疏性等问题。针对目前轨迹数据挖掘中亟待解决在技术难点。本文分别从轨迹数据压缩、时空属性挖掘、用户移动行为的时长预测和空间预测等四个方面展开研究。本研究贯穿了轨迹数据处理、轨迹数据挖掘和智能预测等过程,重点分析了轨迹压缩技术、轨迹挖掘技术和行为预测技术。本文的主要工作概括如下:
(1)针对在信息技术飞速发展的时代,海量轨迹数据带来了巨大的传输和存储开销问题,以及诸多基于位置的应用服务对高采样率和实时采集的轨迹数据的需求。提出了一种面向大规模私家车轨迹收集过程的机会压缩方法(OCT-LSTM)。通过预测模型学习和利用车辆轨迹数据中蕴含的时空属性,以预测值替代传输过程的策略,实现车辆轨迹数据传输过程中的压缩。具体而言,首先通过时空变化方法,将轨迹数据简化成空间路径和时间距离序列两个部分,并分别进行压缩。对于空间路径数据采用字典压缩方式;对于时间距离序列,通过训练基于长短期记忆网络的预测模型,来记忆和学习在历史数据中出现的运动模式,并对此进行预测。利用OCT-LSTM方法可以显著降低轨迹数据的传输开销(在压缩误差小于25的情况下实现了约127.3倍的压缩比),且可以实现低时延的轨迹压缩处理(运算时延约1.81秒),有益于实现低成本高采样率的车辆轨迹数据实时传输。
(2)面对私家车轨迹数据中蕴含深层次时空信息(如:空间相似性、多尺度移动和时间周期性等等),设计了基于私家车轨迹数据的用户出行行为挖掘方法。首先,提出了一种基于滑动窗口的车辆状态在线检测方法,可以从实时采集的轨迹数据中即时检测出车辆的状态,将抽象的私家车用户轨迹数据转化为对有价值的移动行为数据;然后,挖掘了私家车用户移动行为数据的空间属性,提出了一种用户聚集效应的密度聚类方法,并分析了用户移动行为在空间层面的分布特点和多尺度移动属性;最后,挖掘了用户移动行为数据的时间属性,并给出了一种用户出行行为时空差异性的度量方法。
(3)停留时间是理解用户停留行为和出行动机的重要指标之一,但用户的行为受多因素影响和具有随机性的特性,如何有效利用轨迹数据预测用户的停留行为时长仍然是一个有挑战的问题。对此,本文研究了一种面向私家车用户停留行为的时长预测方法(STP)。在数据驱动的智能模型构建方面,设计了一种密度聚类和核密度估计的时空特征提取方法,针对性的利用了私家车用户的停留行为数据的空间相似性、时间周期性和时空相关的特性。并结合基于梯度提升回归树的用户停留行为时长预测模型,并通过大规模真实私家车轨迹数据验证了实验方法,STP方法能达到RMSE值约123.94(R2值约0.893)的预测效果。
(4)深入理解用户移动行为,准确预测用户未来的出行目的地,已成实现与位置相关的智能化服务的重要基础条件。利用用户出行行为的探索性和时空依赖性,本文进一步探索了对私家车用户出行行为的位置预测方法(TBP)。分析了用户出行行为中的探索出行行为(访问新地点),通过挖掘出行行为的距离、方向和时间规律属性,设计了一种对私家车用户探索出行行为的预测方法(TBP-E),可以预测用户的出行目的地是否是从未访问过的新地点。进一步,通过挖掘用户出行目的地的时空关联属性,研究了用户出行的时空引力模型,并提出了一种私家车用户出行行为的地点预测方法(TBP-L),可以实现对用户出行目的地的有效预测。
然而,在轨迹数据挖掘中,由于轨迹数据的时空序列性、稀疏性、噪声干扰和蕴含深层次的时空属性等特点。轨迹数据挖掘与传统数据挖掘具有诸多不同,有许多技术难题需要开展研究,如:数据不平衡、数据稀疏性等问题。针对目前轨迹数据挖掘中亟待解决在技术难点。本文分别从轨迹数据压缩、时空属性挖掘、用户移动行为的时长预测和空间预测等四个方面展开研究。本研究贯穿了轨迹数据处理、轨迹数据挖掘和智能预测等过程,重点分析了轨迹压缩技术、轨迹挖掘技术和行为预测技术。本文的主要工作概括如下:
(1)针对在信息技术飞速发展的时代,海量轨迹数据带来了巨大的传输和存储开销问题,以及诸多基于位置的应用服务对高采样率和实时采集的轨迹数据的需求。提出了一种面向大规模私家车轨迹收集过程的机会压缩方法(OCT-LSTM)。通过预测模型学习和利用车辆轨迹数据中蕴含的时空属性,以预测值替代传输过程的策略,实现车辆轨迹数据传输过程中的压缩。具体而言,首先通过时空变化方法,将轨迹数据简化成空间路径和时间距离序列两个部分,并分别进行压缩。对于空间路径数据采用字典压缩方式;对于时间距离序列,通过训练基于长短期记忆网络的预测模型,来记忆和学习在历史数据中出现的运动模式,并对此进行预测。利用OCT-LSTM方法可以显著降低轨迹数据的传输开销(在压缩误差小于25的情况下实现了约127.3倍的压缩比),且可以实现低时延的轨迹压缩处理(运算时延约1.81秒),有益于实现低成本高采样率的车辆轨迹数据实时传输。
(2)面对私家车轨迹数据中蕴含深层次时空信息(如:空间相似性、多尺度移动和时间周期性等等),设计了基于私家车轨迹数据的用户出行行为挖掘方法。首先,提出了一种基于滑动窗口的车辆状态在线检测方法,可以从实时采集的轨迹数据中即时检测出车辆的状态,将抽象的私家车用户轨迹数据转化为对有价值的移动行为数据;然后,挖掘了私家车用户移动行为数据的空间属性,提出了一种用户聚集效应的密度聚类方法,并分析了用户移动行为在空间层面的分布特点和多尺度移动属性;最后,挖掘了用户移动行为数据的时间属性,并给出了一种用户出行行为时空差异性的度量方法。
(3)停留时间是理解用户停留行为和出行动机的重要指标之一,但用户的行为受多因素影响和具有随机性的特性,如何有效利用轨迹数据预测用户的停留行为时长仍然是一个有挑战的问题。对此,本文研究了一种面向私家车用户停留行为的时长预测方法(STP)。在数据驱动的智能模型构建方面,设计了一种密度聚类和核密度估计的时空特征提取方法,针对性的利用了私家车用户的停留行为数据的空间相似性、时间周期性和时空相关的特性。并结合基于梯度提升回归树的用户停留行为时长预测模型,并通过大规模真实私家车轨迹数据验证了实验方法,STP方法能达到RMSE值约123.94(R2值约0.893)的预测效果。
(4)深入理解用户移动行为,准确预测用户未来的出行目的地,已成实现与位置相关的智能化服务的重要基础条件。利用用户出行行为的探索性和时空依赖性,本文进一步探索了对私家车用户出行行为的位置预测方法(TBP)。分析了用户出行行为中的探索出行行为(访问新地点),通过挖掘出行行为的距离、方向和时间规律属性,设计了一种对私家车用户探索出行行为的预测方法(TBP-E),可以预测用户的出行目的地是否是从未访问过的新地点。进一步,通过挖掘用户出行目的地的时空关联属性,研究了用户出行的时空引力模型,并提出了一种私家车用户出行行为的地点预测方法(TBP-L),可以实现对用户出行目的地的有效预测。