【摘 要】
:
随着智能手机等便携式GPS设备的普及,高效地收集包含丰富时空信息的旅客GPS数据成为可能。对大量的旅客GPS数据进行轨迹挖掘,一方面有助于管理部门理解城市旅客的出行模式,为交通调度、城市规划等宏观政策提供支持;另一方面,也能够帮助描绘旅客画像,服务于基于位置的广告推荐、旅客目的地预测等任务。本文针对GPS轨迹挖掘中的旅客轨迹分段、交通模式识别和目的地预测三个关键问题展开研究。主要贡献如下:(1)提
论文部分内容阅读
随着智能手机等便携式GPS设备的普及,高效地收集包含丰富时空信息的旅客GPS数据成为可能。对大量的旅客GPS数据进行轨迹挖掘,一方面有助于管理部门理解城市旅客的出行模式,为交通调度、城市规划等宏观政策提供支持;另一方面,也能够帮助描绘旅客画像,服务于基于位置的广告推荐、旅客目的地预测等任务。本文针对GPS轨迹挖掘中的旅客轨迹分段、交通模式识别和目的地预测三个关键问题展开研究。主要贡献如下:(1)提出了一种融合时空特征的轨迹分段模型STCPD(Spatial-Temporal Change Points Detect)。该模型提取GPS记录点的空间形态特征和时序运动特征并利用多视图深度网络识别候选分段点,进而通过均值滤波和均值漂移聚类筛选分段点。通过实验分析,STCPD的分段点识别F1分数相对于基线算法有所提升。(2)提出了一种融合地理信息的半监督交通模式识别模型Geo SDVA(Geoinformation Semi-supervised Dirichlet Auto-Encoder)。该模型结合轨迹运动与周围地理信息构建轨迹特征,并通过基于变分自编码器的半监督模型利用大量无标签轨迹与少量有标签轨迹实现对轨迹交通模式的识别。经实验分析,Geo SDVA的交通模式识别准确率在两个真实GPS数据集上相对于基线算法有所提升。(3)提出了一种融合区域语义和出行交通模式的旅客目的地预测模型SEDP(Semantic Embedding Destination Prediction)。该模型利用预训练模型从已知旅客轨迹中提取语义特征,结合历史热门目的地利用并行Bi-GRU模型预测旅客目的地。经实验分析,在两个真实GPS数据集上SEDP的目的地预测MHD误差相较于基线算法有所降低。综上所述,本文围绕轨迹挖掘中的关键性任务,提出STCPD模型通过融合时空特征,提升了基于旅客行为的轨迹分段的分段性能;提出交通模式识别模型Geo SDVA,通过变分自编码器解决了带标签轨迹数量稀少的交通模式识别问题;提出目的地预测模型SEDP,通过结合语义特征更为精确地预测旅客目的地。本文研究可以应用于交通规划和旅游管理等领域,具有实际意义。
其他文献
在无人车应用问题的研究中,如何高效且安全地为无人车规划路径一直是一项热门且充满挑战的研究内容。传统的无人车路径规划算法主要包括全局路径规划算法和局部路径规划算法。其中,全局路径规划算法通过预先处理场景中静态障碍物信息,为无人车规划避障导航路径;局部路径规划算法通过无人车的激光雷达传感器或红外线传感器等接收装置读取地图场景中的动态障碍物信息,实时为无人车提供避障路径规划。随着人工智能领域科学技术的发
中国已经进入了深度的老龄化社会,老人的赡养保障也成为了中国亟待解决的重难点问题。2021年,“十四五规划”明确提出:“要发展多层次、多支柱养老保险制度体系。”要在我国社会救助兜底、第一支柱基本养老金维持基本生活的基础上,大力建设企业年金与职业年金,发挥其补充保障作用。但现阶段,我国企业年金覆盖范围狭窄、参与率低下,这也导致企业年金平均养老金替代率比较低,距离目标替代率较远。因此现阶段,对企业年金养
近年来,凭借着对数字技术的灵活运用,互联网金融公司为客户提供第三方支付、线上理财、线上存贷款等创新的金融服务和金融产品。这些互联网金融产品和服务凭借着低门槛、方便快捷的特点,迅速完成了客户的积累和规模的扩张,对商业银行的业务产生直接或者间接的竞争。在传统的金融体系中,商业银行是金融市场上资金的供给者,因此在金融市场有着垄断的地位。互联网金融企业则打破了商业银行原本在金融市场的垄断地位,对银行业造成
我国人均收入水平不断提高,仍然存在收入差距过大的问题。改革开放以来,我国居民人均可支配收入实现二十年翻三番,城镇新增就业人口连续7年超过1300万人,832个贫困县和12.8万个贫困村全部摘帽,现行标准下近1亿农村贫困人口全部脱贫,建成了世界最大的社会保障网,社会保障建设取得新成效。但也必须清醒认识到,我国中等收入群体的比重仍旧偏低,收入结构仍偏重“哑铃”型,且收入分配不均现象长期存在,收入差距依
逻辑回归作为一种模型解释度高的分类算法,经常运用于很多领域中,可以得到很好的效果。不过,传统的逻辑回归在处理高维的且变量间相关性很强的数据时,效果不尽如人意。学者们提出过多种解决办法,正则化是其中效果较好的一种方法。本文拟采取正则化的方法,提出双权重弹性网-逻辑回归多步筛选算法。将一范数自适应权重、二范数相关性权重、多步迭代等思想引入逻辑回归模型的正则化惩罚中,实现逻辑回归在高维数据下获得稀疏解并
社交媒体数据的体量随着网络技术的发展得到了飞速增长,而社交数据能够真实反映用户的心理、情绪等信息,除此之外对一些有害信息进行及时鉴别也是十分必要的。而随着移动设备的发展,越来越多的用户选择在社交媒体上分享自己的视频、图像、音频等数据,社交媒体数据已经呈现多模态化的趋势。然而对多模态数据进行分析仍然存在许多问题,主要包括了模态间数据表现形式不统一的问题以及模态间表征内容不统一的问题。受限于模态间数据
随着计算机及其相关技术的发展,如何将数字化与文物研究更好地结合是很多研究者关注的热点问题。工业CT技术能够在不损伤文物的前提下得到文物的内部信息,通过这些信息可以实现文物的三维建模。基于CT断层图像进行三维建模的常用方法是面绘制算法和体绘制算法。本文主要基于面绘制的切片级重建算法展开研究,从轮廓对应、轮廓分支和轮廓拼接三个方面展开讨论。针对轮廓对应和分支存在多义性与不确定性问题以及轮廓拼接存在准确
2020年初突然爆发的新冠肺炎严重影响了全球人民的正常生活。至今新冠疫情仍然不断反复,是21世纪以来人来面临的最大公共卫生危机事件。随着互联网技术的发展,在疫情防控的过程中新闻媒体起到的作用受到了专业人士的肯定。新闻传播在稳定民众情绪,引导正确的舆论导向以及帮助维持社会秩序上起到了重要的作用。目前有关新冠肺炎相关新闻的研究还处于初级阶段,主要研究都是通过新闻学的视角来研究媒体舆论导向以及新冠肺炎对
“双循环”新发展格局于2020年5月中央政治局常委会会议首次被提出,引发学者热议。但当前学术界的研究主要集中于理论层面,需要更多的实证分析来对其进行验证。本文从内外需求的视角出发,对“双循环”新发展格局的相关概念进行了阐述及定义;然后基于全球价值链的GDP分解方法,结合本文对内外循环的定义建立新的模型,将一国的GDP分解为消费内循环增加值、投资内循环增加值、简单外循环增加值与复杂外循环增加值两大类
随着计算机技术的不断发展,机器感知与人类认知也愈发趋于统一。在此背景下,传统的二维数据模型因已无法满足在计算机中对三维世界进行表达的需求,逐渐被三维数据模型所取代。在众多三维数字化模型中,由于点云模型具有易采集、几何特征丰富等特点,使其发展成为三维模型处理中一种极其重要的数据载体。然而,由于点云模型中各样本点的无序分布和缺少潜在的拓扑连接关系,使得点云模型的后续处理工作变得十分复杂,因此对三维点云