论文部分内容阅读
在当下计算机及网络广泛应用的时代,带有位置传感器的计算设备更是无时无刻不在运转,它们记录着人、车辆等移动用户的运动轨迹。这些轨迹信息随着时间的推移及使用量的增大而不断扩大规模,如何从大量的轨迹信息中提取有用的信息成为当前的一个研究热点。本文设计并实现了一种利用轨迹信息进行用户行为预测的方法,具体为用户轨迹预测和用户特定行为预测两个模块。用户轨迹预测模块能够利用用户的大量历史行为轨迹信息,对用户当前的活动轨迹进行实时的预测。本文提出了一种基于改进的SATP模型的轨迹预测方法。首先针对大量的轨迹点数据,根据角度变化与MDL原则分别进行轨迹点精简,然后利用两步聚类的方法,为模型进行状态约减。之后针对原始SATP模型可能存在的状态停留、不连续等问题,通过在模型中加入“自转移”来高效解决。最后对于本文所述方法存在的“过分精简”而导致预测精度下降,通过基于贝塞尔曲线的轨迹补全方法来解决。本文还通过将两步聚类方法与SinglePass和DBSCAN算法相比较,发现两步聚类可以在基本保持DBSCAN聚类效果的同时,大大降低了聚类的时间消耗。同时通过将改进后的SATP模型与原始模型做对比,发现后者能够在精度下降很小的同时,明显加快模型的速度。在用户特定行为的预测模块的设计与实现中,本文首先根据项目中典型的用户特定行为“同行行为”设计了它具体的定义。然后围绕该定义,提出了基于大量的用户轨迹识别同行行为的方法,并利用分组处理策略优化该方法。基于同行行为记录,将BP神经网络与朴素贝叶斯模型分别应用到不同类型数据的预测上,详细设计了适用于本文的数据预测方法。本文首先对于提出的同行行为识别的方法进行不同数据量的测试,发现方法耗时随着数据量的增加而增加,但总体满足项目需求。同时,结合百度地图实现的界面检验了本方法识别的正确性。另外,本文利用不同的模型参数分别对模型进行训练与预测的测试,通过对预测误差的比较得到最佳的模型参数,并在训练与预测时耗方面进行了进一步测试,说明本文方法预测效果较好且能够应用于本文项目。本文设计的两个模块均已在用户行为分析系统上得到应用。