出租车轨迹快速搜索聚类算法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:li452546674
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着卫星定位技术以及无线通讯技术的迅速发展,移动对象上安装的移动定位设备也越来越多,GPS轨迹数据的获取也变得越来越容易,由此也产生了海量的轨迹数据,如何大量轨迹数据中挖掘有价值的信息已变得非常重要。目前,较为热门的轨迹数据挖掘方向为轨迹聚类,通过轨迹聚类,发现这些移动对象的运动规律及行为特点,为商业决策及城市发展规划提供一些参考。出租车作为城市交通的重要组成部分,其轨迹数据具有分布广、数据量大和易获取等特点。同时,出租车作为人们交通出行的重要选择,其数据可以很好的反应人们的出行规律。本文以北京市2012年的出租车数据为例,通过对轨迹数据处理、轨迹相似性度量及轨迹聚类的方法理论研究,对数据进行了筛选、降噪及压缩等数据处理工作,然后对比不同的轨迹相似性计算方法,结合出租车轨迹特征,选取合适的距离度量方案,计算轨迹间的相似性距离,最后依照相似距离对轨迹数据进行聚类,从中分析城市的热点路径。本文的具体研究工作如下:(1)基于出租车轨迹的高精度压缩算法本文在轨迹数据的处理中,除了对轨迹数据进行降低数据精度、筛选轨迹数据及子轨迹划分等操作外,还对Douglas-Peucker轨迹压缩算法进行了改进,在轨迹压缩算法中加入对坐标的转换,使之能压缩GPS轨迹数据。在轨迹压缩过程中,加入对噪声数据的识别及删除操作。实验证明,改进后的压缩算法,在进一步提高压缩效率的同时,很好的保留了轨迹形状,保证了数据的精准性。(2)基于出租车轨迹的快速搜索聚类算法针对基于密度峰值的快速搜索聚类算法中关于截断距离选取相对不合理的问题,本文参考数据域中参数的确定方法,结合出租车轨迹数据特点,对基于密度的快速搜索聚类算法进行改进,通过势能熵的方式确定更加合理的截断距离。实验证明该方法可以很好的完成聚类中心的选取。(3)城市热点路径分析本文通过对比不同轨迹相似性度量的聚类结果,发现更适合本文的轨迹相似性度量方案SSPD。通过对不同时间段内的轨迹数据进行聚类,分析城市热点路径,挖掘人们的出行规律,发现城市热点载客路径,便于有关部门更加合理的分配交通资源。
其他文献
快速成型技术又称3D打印技术或增材制造技术,是这几年来广泛推广并得到飞速发展并充分应用的一种生产技术,控制系统是快速成型机的核心部分,控制系统水平高低对制造速度、精
多智能体系统在进行分布式协作控制任务时,首要目标是促使系统成员的指定状态值达成一致。Olfati-Saber提出离散时间一致性协议要求智能体在演化过程中与每一个邻居进行通信协作。然而,当大规模多智能体系统依据上述控制协议进行演化时,存在通信冗余与无效的邻域信息会限制系统的收敛一致的能力和系统收敛一致的速度。因此需要为一致性协议设计出合理有效的邻域成员选取策略减少不必要的通信。保持系统通信拓扑的连通
北京电力科学院电子资源管理系统是为解决科学院现存海量资源难以系统化管理的问题而研发的系统。通过本系统的研发实现了对北京电力科学院自身系统资源进行系统化、规范化管
纳米反应器是指多个分子以特定方式连接而形成的一类具有催化活性的人工模拟酶分子或分子组装体,因其可基于分子层次上对空腔的微环境及催化过程进行模拟再现,从而引起了广大研究者的注意。根据组装分子的数量和空间排列,可收敛自组装成有限的离散型单分子笼状纳米反应器,或发散自组装成无限的聚合网状纳米反应器。笼状纳米反应器具有更好的溶解性及显著的客体响应能力,其在气体分子的储存与分离、活性中间体的捕捉、离子/分子
说话人识别是一种利用说话者的声学特征来进行身份验证的技术,又称为声纹识别。我们知道,人类的声纹是独特的、简单易得的、并且非常稳定的,说话人识别技术利用人类声纹的特
互联网技术飞速发展,用户每天通过在线社交会产生大量数据,通过对数据的分析及利用可以为人们创造更多的价值。而高效的图匹配技术可以为数据分析提供鼎力支持。图模式匹配(G
随着电子信息技术的迅速发展,对电子元器件的小型化、低成本、多功能化以及高稳定性的要求越来越高,对相应材料也提出了更高的要求。钨青铜结构材料作为重要的一种功能材料,具有优异的介电、铁电及非线性光学等性能,得到了广泛的应用。钨青铜型材料复杂的晶体结构极大的丰富了其性能调节和优化的可能性。遗憾的是,目前对钨青铜结构材料的电学和非线性光学性能研究较多,但多为单一研究的性能,多种性能的系统性研究很少。同时对
海洋是重要的战略空间和后备资源宝库,伴随着我国综合国力的不断增强,国际间深海领域的竞争也逐渐激烈。因此大力发展海洋高新技术,提升国家竞争力成为关键。感应耦合锚系链
聚类分析是探索数据内在关系的一种最重要的技术,其应用范围包括统计学、计算机科学、生物信息学等。迄今为止,许多学者,针对不同的问题和应用环境,提出了不同的聚类算法。在
近年来,国家电网提出采用新一代具有抗干扰能力强、低功耗等特点的宽带微功率无线抄表技术来替代窄带微功率抄表。由于Chirp扩频调制技术与宽带微功率无线抄表技术的需求十分