论文部分内容阅读
近年来,随着计算技术和硬件技术不断革新,电子设备不断的智能化而且更加便携,像无线传感器,PDA,智能手机等电子设备都拥有了强大的计算能力。这些小型智能设备为基于位置的服务提供了方便,有很多的应用都可以从用户的位置数据中获得有用的信息。比如广告,基于位置的服务(LBS),路径规划与预测等。 然而,这些应用所需要的用户移动路径信息无法直接从手机中获取。手机捕获到的移动信息只是一些底层的位置信息,比如由GPS获取到的经纬度信息,或者是基站信息等,无法直接被其他应用使用。因此本课题要解决的主要问题是如何从利用手机采集到的底层用户位置数据来挖掘用户的移动模式,为路径预测等应用提供方便。本课题的主要研究内容包括几个方面: 首先,解决信号漂移现象对构造路径的影响。在分析基站数据时,发现手机记录的基站数据同样会出现Wi-Fi网络中的信号漂移问题。即在数据采集过程中,用户并没有移动,但是记录到的基站信息却发生变化,产生多条记录。这样就会对路径的构造产生影响,使得原本应该成为终点的记录没有被正确的划分。针对信号漂移的问题本课题采用了层次图聚类的方法对记录中的基站进行聚类,将记录中的基站数据变成相应的地点,从而解决了信号漂移的问题。 其次,本课题采用改进的序列模式挖掘算法挖掘用户的频繁模式。针对用户路径数据的特点,采用构造有向路径拓扑图的方法,消除了大量无用的候选项集,提高了算法执行的效率。同时,本课题针对群体的移动特征进行了挖掘,分析特征发现同一群体内的用户会存在相似性。 最后,对如何预测用户位置进行了分析,给出了预测方法。通过实验表明,利用挖掘出的用户频繁模式,以及模式的时间分布概率,能够很好的预测用户的位置。 通过本文内容的研究,从原始的基站数据挖掘出了单个用户和群体用户的频繁移动模式,为基于位置的服务以及路径规划与预测等应用提供了支持。