论文部分内容阅读
随着Web2.0时代的到来和社交媒体的普及,以社交媒体数据为基础的人口监测能够成为传统人口调查的有益补充,根据其中大量的用户活动时空信息识别其中的流动人口,并进一步将流动人口分类,研究其出行特征及与城市交通的关系,能够使城市交通对流动人口的服务更加有的放矢。
为识别社交媒体用户中的流动人口,本研究首先界定了人口本地性及其四种类型:长期居民、临时居民、访问者和游客并将后三类视为流动人口,而后从时间、空间和社交三个角度分析提取了社交媒体的用户特征,同时设计了用于本地性评估的对应分类条件和分类顺序。随后,利用伦敦地区推特数据集,评估数据集覆盖时间内当地推特用户本地性,将这些用户的推文时空信息用于提取其对应群体出行特征。
本文利用相关系数、空间聚类等方式从时间和空间两个角度分别分析了流动人口在伦敦地区内的出行特征及其与伦敦地区城市交通的关系,得出以下结论:
(1)整体上伦敦地区流动人口出入伦敦频次随时间变化,例如在2018年2月和5月有较少的流动人口变动,若只考虑停留时间少于一周的访问者和游客,每年7、8、12月是这类流动人口进出伦敦地区的高峰时期,这段时间流动人口可能对城市交通系统造成较大负担。
(2)绝大多数社交媒体用户的活动地点分布在距离公共交通站点较近的区域,活动地点与轨道交通站点之间的距离随本地性的降低而呈现出递减的趋势,即在当地停留时间越短的人口群体其活动地点距离轨道交通站点越近。
(3)游客停留时间比例与地铁和地面公交的交通量有显著的正相关关系,其相关系数分别达到了0.69和0.52,而访问者和临时居民与地铁、公交的交通量以及各类流动人口与私人交通交通量的线性相关关系不显著。
(4)利用基于密度的聚类算法得到各类本地性人口的出行活动聚类中心,经分析得出结论:长期居民、临时居民、访问者和游客的聚类中心依次减少且聚类中心的分布越来越密集;各类人口的聚类中心都在城市公共交通站点分布密集的区域或轨道交通沿线。
为识别社交媒体用户中的流动人口,本研究首先界定了人口本地性及其四种类型:长期居民、临时居民、访问者和游客并将后三类视为流动人口,而后从时间、空间和社交三个角度分析提取了社交媒体的用户特征,同时设计了用于本地性评估的对应分类条件和分类顺序。随后,利用伦敦地区推特数据集,评估数据集覆盖时间内当地推特用户本地性,将这些用户的推文时空信息用于提取其对应群体出行特征。
本文利用相关系数、空间聚类等方式从时间和空间两个角度分别分析了流动人口在伦敦地区内的出行特征及其与伦敦地区城市交通的关系,得出以下结论:
(1)整体上伦敦地区流动人口出入伦敦频次随时间变化,例如在2018年2月和5月有较少的流动人口变动,若只考虑停留时间少于一周的访问者和游客,每年7、8、12月是这类流动人口进出伦敦地区的高峰时期,这段时间流动人口可能对城市交通系统造成较大负担。
(2)绝大多数社交媒体用户的活动地点分布在距离公共交通站点较近的区域,活动地点与轨道交通站点之间的距离随本地性的降低而呈现出递减的趋势,即在当地停留时间越短的人口群体其活动地点距离轨道交通站点越近。
(3)游客停留时间比例与地铁和地面公交的交通量有显著的正相关关系,其相关系数分别达到了0.69和0.52,而访问者和临时居民与地铁、公交的交通量以及各类流动人口与私人交通交通量的线性相关关系不显著。
(4)利用基于密度的聚类算法得到各类本地性人口的出行活动聚类中心,经分析得出结论:长期居民、临时居民、访问者和游客的聚类中心依次减少且聚类中心的分布越来越密集;各类人口的聚类中心都在城市公共交通站点分布密集的区域或轨道交通沿线。