论文部分内容阅读
随着全球定位系统(Global Positioning System)GPS技术的快速发展,轨迹数据大量增长,为轨迹信息所蕴含的深层语义信息挖掘提供了可能。轨迹识别作为轨迹数据的重要研究部分,在实际研究中具有广泛的应用场景,可以为公司提供技术支持,以实现地图服务、旅游推荐等;为政府部门提供决策依据,以实现城市交通管理、城市规划和居民出行建议等。目前许多研究仅以轨迹点的停留点识别、停留语义识别等,单纯研究轨迹点,没有向更广的区域去研究;而在停留区域轨迹研究方面,仅仅研究单个类型的轨迹数据,而没有研究混合类型的轨迹数据。针对以上的问题,本文主要对停留点识别和停留区域识别两个方面进行轨迹识别研究。主要的研究内容如下:(1)停留点识别。已往的停留点识别方法通常以轨迹点经纬度转换的空间位置信息和时间来进行聚类,由于聚类和约束时所用的数据特征是分离的,因此在约束阶段效果并不理想。本文针对以往对停留点识别所存在的缺陷,提出了基于时空约束密度聚类的停留点识别算法,在聚类阶段和约束阶段同时使用相同的轨迹数据特征速度和距离的密度聚类方法,因为算法在聚类部分和约束部分同时利用了速度和距离等轨迹数据特征条件,改进了以往单纯利用时间和空间进行聚类,而使用其它条件进行约束方式的情况,所以这能够有效处理在整个停留点识别部分数据特征分离的情况。(2)停留区域识别。在已对停留点识别的基础上,识别更深类型的轨迹信息。深层次的轨迹数据信息需要深层次的识别方法,由于轨迹特征数据是一维的并且轨迹数据具有时间序列特征,因此基于长短时记忆网络(Long Short Term Mermory network,LSTM)的深度学习方法对停留区域轨迹进行识别。LSTM深度学习方法能够获得之前学习过的内容,有效筛选之前有用的信息,剔除之前冗余的信息,因此能够有效把握个体出行轨迹的前后关系。LSTM深度学习方法还有其它不同的改进模型,改进模型有各自的独特优势,例如,LSTM的衍生模型双向LSTM模型(BiLSTM)在每层BiLSTM层都进行向前向后学习,能够有效获得轨迹数据的细腻前后信息,对于原模型有着获得所有的信息特征优势;门控制循环单元(GRU)模型则是简化了的LSTM模型,GRU的逻辑门更少,但是在不牺牲预测准确率的同时,提高了模型的运算效率。此外,基于LSTM的注意力机制模型则能够关注关键的信息特征,在LSTM模型学习的时候,关注影响模型比较多的权重,将更多的资源利用在重要特征上,因此提高了模型的识别准确率。实验利用GPS轨迹数据进行研究,首先进行轨迹预处理,然后进行停留点的识别,最后进行停留区域轨迹识别。实验分析了各种不同的方法,在此基础上加以改进研究,实验的结果表明,本文所提供的方法的识别准确率高。