基于熵估计的稀疏轨迹预测方法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:sure565372
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球定位技术和移动通信技术的快速发展,移动对象产生的轨迹数据规模呈爆炸式增长,对大量的轨迹数据进行存储、处理后进一步挖掘应用的需求越来越多。移动对象的轨迹预测已经成为当前轨迹数据挖掘的研究热点,通过移动对象轨迹预测,对于缓解交通压力、基于位置的应用和服务、用户隐私保护等方面有着重要的意义。本文围绕稀疏轨迹预测方法进行研究,主要工作如下:(1)基于迭代网格划分和熵估计的稀疏轨迹预测方法目前移动对象的轨迹预测方法主要是基于历史轨迹空间的轨迹预测,但是这类方法面临“数据稀疏”问题,即有效的历史轨迹空间不能覆盖所有可能的查询轨迹。为了解决上述问题,本文提出一种基于迭代网格划分和熵估计的稀疏轨迹预测方法(TPDS-SIGP&EE)。首先对轨迹所在区域进行迭代网格划分,并将离散的GPS轨迹点映射到网格图中生成轨迹序列;其次,采用L-Z熵估计计算轨迹序列的熵值,在熵值排序的基础上选择熵值较低的轨迹进行划分形成子轨迹,重新组合子轨迹形成新的轨迹空间,以解决轨迹数据的稀疏问题,同时,使得新的轨迹空间更加可信,且将其规模控制在一定范围内;最后在新的轨迹空间下使用基于马尔可夫模型和贝叶斯推理的子轨迹综合方法进行稀疏轨迹预测。采用微软亚洲研究院T-Drive数据对算法进行测试,实验结果表明,TPDS-SIGP&EE能够有效地进行稀疏环境下的轨迹预测,并且与同类算法相比,该算法的轨迹空间大幅缩小,预测速度快,而预测准确性却有所提高。(2)基于多种熵估计的稀疏轨迹预测方法考虑时间因素对轨迹预测的影响,并引入多种熵估计评价轨迹整体、不同时间段、不同位置上和位置转移的规律性来加强预测准确性,提出了一种基于多种熵估计的稀疏轨迹预测算法(STP-ME)。首先,对轨迹区域进行迭代网格划分并生成带时间标签的轨迹序列;然后使用L-Z熵评估计算完整轨迹序列的L-Z熵值,并引入转移熵作为轨迹划分的依据,在轨迹L-Z熵值和转移熵的基础上进行轨迹划分得到新的轨迹空间;最后结合度量位置受欢迎程度的位置熵和时间段内活跃程度的时间熵,使用带时间维度的二阶马尔可夫模型(2-TMM)进行稀疏轨迹预测。实验表明,在2-TMM的基础上使用多种熵估计可以提高轨迹预测的准确性;当轨迹完整度达到90%以上,Baseline算法的查询覆盖率只有25%左右;而STP-ME算法几乎不受查询轨迹长度的影响,可以预测几乎100%的查询轨迹;并且STP-ME算法的预测准确率最高,分别高于Baseline算法、SubSyn算法和2-MM算法8%、4%和3%左右;同时Baseline算法的预测时间非常长,达到100ms,而STP-ME算法的预测时间(10ms)几乎可以忽略不计。STP-ME算法能够有效地进行稀疏环境下的轨迹预测,具有更广的预测范围,更快的预测速度和较高的预测准确率。
其他文献
近年来,随着无线设备和移动计算技术的不断发展,信息空间和物理空间已经相互交融重叠,形成了一个新的研究领域:普适计算。在普适计算空间中,用户可以随时、随地获得数字化的服务。
随着智能设备在近几年的快速发展,GPS、GSM网络和Wi Fi等定位技术得到了广泛应用,很容易对移动对象进行追踪,由此产生了大量的时空数据。如何从这些海量时空数据中有效地发现
无线传感器网络能够感知周边环境信息并收集相应的数据,在许多领域都有重要的应用前景。传统的数据收集一般通过单跳或多跳无线通信将传感器节点采集的数据汇聚到固定的网络
高科技产品开始不断走进日常生活之中,家庭信息化将成为必然趋势。家庭信息化就是通过一种设备将家庭中所有家用电器及电子设备连接至一起,形成一个智能化的家庭网络,这样就
电能表自动化检测线是对智能电表各项性能指标测控的综合检定平台。该平台由各种机械装置、电子元器件、检测线管理软件及控制系统组成,检测线在使用时容易发生故障。因此,搭建针对电能表自动化检测线智能化运维平台,对检测线的日常运维、电能表检定计划以及检定指标数据的分析非常重要。本文首先说明了检测线智能运维平台的研究背景、目的意义及国内外运维平台研究现状。然后对电能表自动化检测线智能运维平台搭建涉及的技术进行
互联网应用规模的迅速扩张,使服务器端所承受的负载压力越来越大,已经远远超过单台服务器所能承受的极限,从而致使集群技术来承担这种信息需求。目前,大型互联网公司普遍采用
计算机及网络技术、半导体材料及电子制造技术的快速发展促进了微机电系统、片上系统、无线通信和低功耗嵌入式技术的快速发展。本文通过对ZigBee无线传输技术、CC2530芯片和ADXL345三维加速度传感器的研究,设计了一种速度无线测量方法,实现了工业环境中对大型低速间歇式运动机械的速度测量。论文中,首先对近年来比较成熟的几种无线通信技术进行了探讨,特别针对应用最为广泛的ZigBee技术做了进一步的分
随着互联网和电子商务的快速发展,信息过载已经成为目前互联网用户所面临的一个严峻的问题。如何让用户在海量的商品中能快速找到自己喜欢的商品,是每个电子商务网站急需解决的
传统的监督学习往往需要大量的带类别标签(Label)的样本对分类器进行训练。然而,在实际应用中,有标记样本(Labeled data)的获取较困难,无标记样本(Unlabeled data)的获取却很
在现代供电企业中,企业员工的专业技能以及安全意识是供电企业推行安全生产的重要保障。据统计,在电力系统中百分之七十以上的电力事故是由运行人员的误操作引起的,所以提高运行人员的专业知识以及安全意识,意义重大。由于客观因素的原因,对于员工技能的提升以及安全意识的提升,国内外不少电力企业还是采取传统定期的授课方式安全培训学习。这样的学习方式往往流于形式,而且单一的培训加考试的模式,再加上学习方式单调,缺乏