面向海量轨迹数据的聚类算法研究

来源 :北京交通大学 | 被引量 : 38次 | 上传用户:wufala
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着卫星技术、全球定位技术、传感器网络以及电子移动设备等科技的不断进步,基于位置的应用在人们的生活中越来越普遍。实时交通路况监测系统,移动对象实时位置定位系统的应用也越来越广泛。随之而来的是蓬勃发展的基于位置的服务和移动社交网络的普及。移动对象随着时间的变化产生的实时位置信息不断积累,构成了该移动对象在一定时间内的一条运动轨迹。这些由各种不同的移动终端每日产生的巨大数量的轨迹数据,已经成为为不同类型的应用领域进行知识探索的源泉。这些海量轨迹数据中往往隐藏着非常重要的信息。然而,想从这些爆炸式增长的轨迹数据中准确迅速地发掘出对人类有用的信息也绝非易事。加之时空数据处理更为复杂,如何高效管理和利用这些轨迹数据,如何从中挖掘出对不同应用有价值的潜在信息,对当前该领域的研究者和使用者提出了巨大的挑战。在众多数据分析方法当中,聚类作为数据挖掘领域的一种非常重要的数据分析方法,越来越多地被研究人员应用到轨迹数据挖掘的过程当中。针对这一背景,本文主要围绕轨迹数据处理中轨迹划分、子轨迹问距离度量、子轨迹聚类以及移动对象轨迹簇在线实时更新等重要问题展开研究,在此基础上,提出了改进的子轨迹划分算法、新的轨迹距离度量方法和移动对象轨迹簇在线实时更新算法。考虑到移动对象轨迹数据包含新的属性维度,包括位置、时间、速率和方向等,相应的轨迹数据分析应采用新的方法。对于轨迹数据的处理问题,本文摒弃已有方法中所存在的缺陷,不把物体轨迹作为一个整体来处理,而是全面考虑时空数据的多维信息,首先把一条轨迹划分成若干子轨迹,并把子轨迹作为聚类的基本单元;对于子轨迹间距离的度量问题,本文提出了一种多维距离度量方法,综合考虑了时空数据的时间、空间及速率等多维属性,该方法能够根据不同的应用场景更加真实有效地度量不同子轨迹之间的相似程度,从而提高轨迹数据处理的准确性;对于移动对象轨迹簇在线实时更新问题,本文提出了一个新的轨迹簇存储结构实时更新算法,该结构记录了移动对象最新的子轨迹聚类结果,实现了实时在线更新,为轨迹数据的实时应用提供了便利。本文通过在真实出租车GPS轨迹数据上的实验,证明了本文所提出的新的轨迹数据处理方法较之相关算法具有更好的处理效率和聚类效果。这些研究成果具有重要的学术价值和广泛的应用前景。
其他文献
以MAA、BA、BEM、AM为单体,DAP为交联剂,采用乳液聚合制备缔合型碱溶胀增稠剂,对乳液性能的影响因素进行探究。结果表明:乳化剂用量为5%,引发剂为0.25%,聚合温度85℃,预乳液
高致病性猪蓝耳病病毒(HP—PRRSV)(JX-EF112445)核苷酸序列与经典猪蓝耳病病毒(LP-PRRSV)(U87392)核苷酸序列,设计两对特异性引物,建立了HP—PRRSV和LP—PRRSV二重RT-PCR快速检测体系。
第一破案力是对刑事科学技术在刑事侦查作用中的科学定位。新形势下 ,各级公安机关必须大力加强刑事科学技术工作 ,以现代化的技术装备和手段对付犯罪 ,努力提高侦查破案效能
监测数据显示,截至7月10日全国生猪收购周均价、白条猪出厂周均价已连续5周上涨,且涨幅有继续扩大之势。据了解,目前全国各地的毛猪收购价平均已达到每千克11元左右,猪肉零售价也