论文部分内容阅读
随着移动互联网、人工智能的飞速发展,在各种日常应用中产生了海量的移动轨迹数据。如何利用这些轨迹数据快速有效地预测用户未来位置在基于位置服务(LBS)的应用中极具价值。本文以轨迹数据为研究对象,以提升位置预测的效果和效率为研究目标,从多任务关联、多模型集成和模型压缩三个方面进行位置预测研究。移动物体的未来位置通常与其他一些任务相关联,现有的位置预测方法通常是使用单任务模型,没有利用多个关联任务的共享特征来提升彼此的性能。因此,本文提出基于特征共享的多任务位置预测MLoc模型,将轨迹数据通过网格映射后进行Embedding,得到的序列向量输入到长短期记忆网络(LSTM)中,然后通过多任务组件同时训练多个任务,从关联任务中学习到更有意义的特征表示,加强模型的表现力。本文在真实数据集上进行了实验,实验结果显示了MLoc模型对位置预测在准确率上优于目前先进的模型。另外,由于轨迹数据同时具有时间维度和空间维度,而现有模型主要考虑轨迹的序列特征即时间特性,往往不能足够准确地表示轨迹的空间特性,这就降低了位置预测的效果。基于此,本文提出基于多模型的多任务位置预测MMLoc模型,使用卷积神经网络(CNN)提取空间特性,重点捕获移动对象的位置与位置之间的空间关系,使用LSTM来提取移动对象的位置之间的序列关系和时间特性。最后将CNN和LSTM的结果集成后形成多模型组件,将多模型组件得到的特征输入到多任务组件中输出预测结果。本文在真实数据集上进行了实验,实验结果显示了MMLoc模型在准确率、召回率、精准率和F1分数指标上优于目前先进的模型。最后,考虑到位置预测在移动端的应用需求,需要模型在资源受限的环境中进行工作,因此如何对模型进行压缩来提升模型运行效率成为重要的研究课题。本文通过知识蒸馏的方法将教师模型MMLoc模型压缩成简单的学生模型。具体来说,通过设计多任务蒸馏损失函数,将MMLoc模型训练成简单的学生模型,实现知识迁移。实验结果表明,该压缩模型能有效减小多任务位置预测模型的大小,提升多任务位置预测模型的运行效率。