论文部分内容阅读
摘 要:本课题基于wifi探针的大数据技术,改变大客流处置方式从被动应对式、人工型、经验型向主动防控式、精细化、自动化、科学化转变,提高城市轨道交通车站大客流风险管理水平和防控能力,为实现轨道车站运营管理的信息化、自动化、高效化提供技术支撑。本课题利用WiFi探针来进行轨道车站客流数据的采集,在此基础上深入研究轨道车站拥堵点客流状态表征参数及其动态估计方法 。研究基于网格划分的地铁车站WiFi探针布设及数据采集方案,以车站局部拥堵点的排队延误时间建立WiFi探针的大客流状态评价指标动态估计方法。研究成果可为轨道车站大客流安全风险管理决策和大客流预警系统开发提供方法与技术支撑。
关键词:WIFI探针;拥堵点;客流状态表征参数,动态估计方法
1研究背景
随着上海社会经济的快速发展和轨道交通线网规模的不断扩展,轨交路网客流总量持续增长,目前全网已处于千万客流的新常态。在早晚通勤高峰时段、大型活动举办期间、重大节假日、突发性运营延误或其他紧急事件等情况下,全部或局部线网更会面临远超日常客流量的常态或临时性超大客流的严峻挑战。尤其对于地下封闭式车站,客流的极度拥挤、人流行走的严重交叉干扰,不仅大大降低乘客出行效率和舒适性,而且极大增加了安全隐患和风险,极易因集中大规模无序拥挤而导致大面积踩踏、客伤等危险事故,后果不堪设想。
实践中,上海、北京、广州等城市轨道交通运营管理部门已陆续开展大客流安全风险管理专项工作。目前伦敦地铁已率先启动了“利用WiFi数据提升轨道交通运营效率及服务水平”的行动计划。因此,本課题基于WIFI探针技术建立轨道车站客流参数动态采集及估计方法,为轨道车站提供了客流状态表征参数,推进轨道车站大客流运营管理的信息化、自动化、高效化的实现。
2研究的目的
目前,轨道车站运营管理采集缺乏科学理论方法和现代化技术手段的支撑,已有实践尚处于人工化管理阶段,仅依赖于传统AFC数据、人工视频监控和主观性经验进行决策,难以确保决策效果和效率。本文基于wifi探针的大数据技术,改变大客流处置方式从被动应对式、人工型、经验型向主动防控式、精细化、自动化、科学化转变,提高城市轨道交通车站大客流风险管理水平和防控能力,为实现轨道车站运营管理的信息化、自动化、高效化提供技术支撑。
本文从理论与实践角度,对现状中轨道客流状态辨识存在的问题进行了研究,主要目的有以下几点:
(2)建立一套基于WiFi探针的轨道车站拥堵点客流状态表征参数体系;
(3)建立一种基于WiFi探针的轨道车站拥堵点客流状态表征参数动态估计方法;
(4)与上海申通地铁公司共建WIFI探针示范研究与应用车站。
3 基于Wifi探针的轨道车站拥堵点客流状态参数表征指标估计与分析
3.1 基于Wifi探针的客流状态评价指标
由于轨道车站某些通行设施的通过能力有限,在客流早晚高峰时段,当到达客流量超过设施的通过能力时,就会有大量的乘客在通行设施处排队等候产生拥堵现象。这是一个典型的客流集中拥堵现象,用在各个拥堵点上布设的wifi探针所统计数据的指标来描述轨道车站通行设施拥堵处客流拥堵特征,并用其来评价通行设施处客流拥堵的程度。
延误时间记作T,表示的是每个乘客拥堵点停留时间 与正常通行状态下的乘客拥堵点停留时间 的差,其表达式为
,通常情况下,取该差值的正数部分。它能实时动态上反映了在轨道车站各个通行设施处由于客流量巨大或者通行设施通行能力有限,导致客流拥堵而产生通行延误现象,其数值也可以很直观地反映客流拥堵的程度或严重性。
3.2 WIFI探针的乘客拥堵点停留时间分析
乘客在拥堵点延误时间统计特征分析的主要目的在于研究乘客在各个时段上经过探针的时间的统计特征值的分布规律,本文主要分析以下两个方面的统计特征,一是分析乘客拥堵点停留时间均值,二是乘客拥堵点停留时间时间在不同百分位水平的取值,并对数据的偏差情况进行分析,三是对乘客在拥堵状态下与自由流状态下停留时间进行对比得到延误时间。
本文选取上海市地铁南京东路站10号线2017年1月3日两个时段分别代表自由流时段和高峰拥堵时段(16:00~16:10和17:30~17:40期间)车站站台处扶梯口附近布设的wifi探针的条件下的乘客出现在探针数据内的时间作为基础数据,对乘客拥堵点延误时间的统计特征进行分析。
取10分钟时段内出现在发送端和接收端不同MAC地址的个数,计算每个乘客拥堵点停留时间: 。
其中 是m号WiFi探针探测范围内第n个MAC地址出现的时间长度; 是m号WiFi探针探测范围内第n个MAC地址出现的最后一个时刻; 是m号WiFi探针探测范围内第n个MAC地址出现的第一个时刻。
(1)乘客拥堵点停留时间均值及偏差值分布规律分析
本文对总数据中16:00~16:10的自由流时段中提供乘客拥堵点停留时间数据的均值及偏差值进行统计分析,统计结果如图4-5及表4-6所示:
图1统计结果来看,乘客的拥堵点停留时间在100 S以下分布较密集,在100S以上分布较稀少。
从表2统计结果来看,最大值以及最小值与均值之间存在着较大的偏差,说明该时段乘客在拥堵点停留时间时间波动较大。
非正常数据是指wifi探针在信号干扰、乘客手机wifi信号强弱等环境因素的影响下对乘客停留时间的某些预测数据不具备代表性,是不能用以预测当前拥堵点乘客的停留时间。
因此,本文认为采用乘客在拥堵点停留时间的均值作为当前客流状态下的乘客停留时间是不合适的,它很有可能受非常态数据的干扰,使数据结果出现较大偏差。
(2)乘客拥堵点停留间百分位水平值分布规律分析 百分位水平值是指乘客拥堵点停留时间数据中,将低于该值的数据所占的样本频率作为该值的百分位水平,反映了乘客拥堵点停留时间数据中低于该百分位水平值的样本数据的多少。
对总数据提供的乘客拥堵点停留时间数据进行百分位水平统计分析,将停留时间按照从小到大的顺序进行排列,统计可得各百分位水平值(本文仅对10%、20%、30%...90%的数据进行统计分析),统计结果如表3所示:
各百分位水平值数据与乘客拥堵点停留时间样本数据进行偏差值数据分析。研究发现,各个百分位水平值与路段运行时间数据之间的偏差值曲线呈现出极其相似的变化规律:都是从负值变为正值,而且单调增加;各百分位水平路段运行时间与路段运行时间数据样本之间的偏差值序列中,偏差值零点随着百分位水平的增加而增加。
为了更为方便的研究数据的集中程度,本文对乘客拥堵点停留时间与百分位水平值之间选取偏差率指标进行单独的统计分析,偏差率的计算公式如下:
Poffset为乘客拥堵点停留时间与百分位水平值之间的偏差率,Toffset为乘客拥堵点停留时间与百分位水平值之间的偏差值,Tpercentage为乘客拥堵点停留时间百分位水平值。
偏差率反映了公交车辆运行时间与百分位水平值之间的偏离程度,也间接反映出了乘客拥堵点停留时间相对于百分位水平值的聚散程度。
为了方便直接的比较各个百分位水平值的偏差率大小,在偏差率的数据中取均值得到各个各个百分位水平值的平均偏差率,统计结果如表4所示:
表4显示了乘客拥堵点停留时间与10%~90%位水平值的平均偏差率统计分布,研究发现,不同的百分位值的平均偏差率会有变化,说明乘客拥堵点停留时间是围绕着某一水平值呈现上下波动的特性。当选定精度水平后,总可以找到一个最优的百分位水平值,使得偏差率小于该精度水平的样本数量达到最大。根据本次统计的结果显示,当百分位值取80%时,其与样本数据的平均偏差率最小为63%,所以我们可ss以认为本数据中80分位值可以代表该时间段的乘客拥堵点停留时间特征值。
该研究结论为获取某时段内乘客拥堵点停留时间的特征值提供了依据,使得寻找到的百分位水平值更能代表某时段内乘客拥堵点停留时间。
(3)乘客拥堵点停留时间特征总结
通过上述对乘客拥堵点停留时间的深入分析,总结出乘客拥堵点停留时间具有以下几点特征:
(1)乘客拥堵点停留时间在不同的时间段中有比较明显的差异,尤其是高峰时段的客流拥挤状态与非高峰的自由流状态对比下,更为突显这一特征。我们根据此特征来计算在拥挤状态下的乘客在拥堵点上的延误时间。
(2)乘客拥堵点停留时间均值易受非正常数据的影响,而呈现出一定的偏向性,使得采用均值预测乘客拥堵点停留时间的方法产生了不合理的误差。
(3)利用乘客拥堵点停留时间数据进行统计发现,在满足偏差率较小的情况下(偏差率处于60%左右),乘客拥堵点停留时间聚集在80百分位水平的频率相对较高。
上述特征分析为乘客拥堵点延误时间模型的建立提供了数据保障和理论支撑,使得预测模型更符合实际情况。
(4)乘客拥堵点延误时间计算模型
乘客拥堵点延误时间表示的是每个手机MAC地址出现的时间与正常通行状态下的时间的差,通常情况下,取该差值的正数部分。它能实时动态上反映了在轨道车站各个通行设施处由于客流量巨大或者通行设施通行能力有限,导致客流拥堵而产生通行延误现象,其数值也可以很直观地反映客流拥堵的程度或严重性。
在上文,已经计算出该站站台处扶梯口在自由流时段(即16:00-16:10)的乘客拥堵点停留时间特征值其80分位值作为正常通行状态下的乘客堵点停留时间。沿用上文的研究方法,计算出该站站台处扶梯口在高峰拥堵时段(即17:30-17:40)的乘客拥堵点停留时间特征值。
对总数据提供的乘客拥堵点停留时间数据进行百分位水平统计分析,将停留时间按照从小到大的顺序进行排列,统计可得平均值各百分位水平值(本文仅对10%、20%、30%...90%的数据进行统计分析),统计结果如表5所示:
為了方便直接的比较各个百分位水平值的偏差率大小,在偏差率的数据中取均值得到各个各个百分位水平值的平均偏差率,统计结果如表6所示:
根据本次统计的结果显示,当百分位值取80%时,其与样本数据的平均偏差率最小为63%,所以我们可以认为本数据中80分位值可以代表该时间段的乘客拥堵点停留时间特征值。所以,我们得到了该站站台处扶梯口在17:30-17:40的乘客拥堵点停留时间特征值为161s。
根据上文所得到数据,我们将数据代入我们建立的基于wifi探针的乘客拥堵点延误时间的模型中进行计算,公式如下:
T为乘客拥堵点延误时间, 是该站某个拥堵点非正常通行状态下每个手机MAC地址在wifi探针数据中出现的时间长度, 为该站某个拥堵点正常通行状态下的每个手机MAC地址在wifi探针数据中出现的时间长度。
通过上述公式,我们计算出该站台处扶梯口在17:30-17:40的乘客拥堵点延误时间为23s。
4研究结论
随着城市轨道交通的发展以及对轨道交通运营管理服务水平要求的不断提升,实现轨道车站大客流安全风险管理工作的自动化、科学化、高效化,本文通过对基于WIFI探针的轨道车站客流状态指标的研究,得到以下结论:
(1)乘客拥堵点停留时间在不同的时间段中有比较明显的差异,尤其是高峰时段的客流拥挤状态与非高峰的自由流状态对比下,更为突显这一特征。根据此特征来计算在拥挤状态下的乘客在拥堵点上的延误时间具有对客流状态表征的功能。
(2)基于WIFI探针的轨道车站客流参数动态采集和估计方法的研究成果,有助于提高轨道车站大客流下的运营管理服务水平。
参考文献:
[1] P.hoogendoom.Microscopic Simulation of Pedestrian Flows.[C].Annual Meeting at the Transportation Research Board Proceedings on CD-ROM,2003.
[2]李灿.轨道交通枢纽乘客流交通特性分析及建模北京北京交通大学.[D].北京.北京交通大学,007.
[3]沈丽萍,马董,高世廉.城市轨道交通客流分析城市交通.[J].城市交通,2007.4(3):14-19.
关键词:WIFI探针;拥堵点;客流状态表征参数,动态估计方法
1研究背景
随着上海社会经济的快速发展和轨道交通线网规模的不断扩展,轨交路网客流总量持续增长,目前全网已处于千万客流的新常态。在早晚通勤高峰时段、大型活动举办期间、重大节假日、突发性运营延误或其他紧急事件等情况下,全部或局部线网更会面临远超日常客流量的常态或临时性超大客流的严峻挑战。尤其对于地下封闭式车站,客流的极度拥挤、人流行走的严重交叉干扰,不仅大大降低乘客出行效率和舒适性,而且极大增加了安全隐患和风险,极易因集中大规模无序拥挤而导致大面积踩踏、客伤等危险事故,后果不堪设想。
实践中,上海、北京、广州等城市轨道交通运营管理部门已陆续开展大客流安全风险管理专项工作。目前伦敦地铁已率先启动了“利用WiFi数据提升轨道交通运营效率及服务水平”的行动计划。因此,本課题基于WIFI探针技术建立轨道车站客流参数动态采集及估计方法,为轨道车站提供了客流状态表征参数,推进轨道车站大客流运营管理的信息化、自动化、高效化的实现。
2研究的目的
目前,轨道车站运营管理采集缺乏科学理论方法和现代化技术手段的支撑,已有实践尚处于人工化管理阶段,仅依赖于传统AFC数据、人工视频监控和主观性经验进行决策,难以确保决策效果和效率。本文基于wifi探针的大数据技术,改变大客流处置方式从被动应对式、人工型、经验型向主动防控式、精细化、自动化、科学化转变,提高城市轨道交通车站大客流风险管理水平和防控能力,为实现轨道车站运营管理的信息化、自动化、高效化提供技术支撑。
本文从理论与实践角度,对现状中轨道客流状态辨识存在的问题进行了研究,主要目的有以下几点:
(2)建立一套基于WiFi探针的轨道车站拥堵点客流状态表征参数体系;
(3)建立一种基于WiFi探针的轨道车站拥堵点客流状态表征参数动态估计方法;
(4)与上海申通地铁公司共建WIFI探针示范研究与应用车站。
3 基于Wifi探针的轨道车站拥堵点客流状态参数表征指标估计与分析
3.1 基于Wifi探针的客流状态评价指标
由于轨道车站某些通行设施的通过能力有限,在客流早晚高峰时段,当到达客流量超过设施的通过能力时,就会有大量的乘客在通行设施处排队等候产生拥堵现象。这是一个典型的客流集中拥堵现象,用在各个拥堵点上布设的wifi探针所统计数据的指标来描述轨道车站通行设施拥堵处客流拥堵特征,并用其来评价通行设施处客流拥堵的程度。
延误时间记作T,表示的是每个乘客拥堵点停留时间 与正常通行状态下的乘客拥堵点停留时间 的差,其表达式为
,通常情况下,取该差值的正数部分。它能实时动态上反映了在轨道车站各个通行设施处由于客流量巨大或者通行设施通行能力有限,导致客流拥堵而产生通行延误现象,其数值也可以很直观地反映客流拥堵的程度或严重性。
3.2 WIFI探针的乘客拥堵点停留时间分析
乘客在拥堵点延误时间统计特征分析的主要目的在于研究乘客在各个时段上经过探针的时间的统计特征值的分布规律,本文主要分析以下两个方面的统计特征,一是分析乘客拥堵点停留时间均值,二是乘客拥堵点停留时间时间在不同百分位水平的取值,并对数据的偏差情况进行分析,三是对乘客在拥堵状态下与自由流状态下停留时间进行对比得到延误时间。
本文选取上海市地铁南京东路站10号线2017年1月3日两个时段分别代表自由流时段和高峰拥堵时段(16:00~16:10和17:30~17:40期间)车站站台处扶梯口附近布设的wifi探针的条件下的乘客出现在探针数据内的时间作为基础数据,对乘客拥堵点延误时间的统计特征进行分析。
取10分钟时段内出现在发送端和接收端不同MAC地址的个数,计算每个乘客拥堵点停留时间: 。
其中 是m号WiFi探针探测范围内第n个MAC地址出现的时间长度; 是m号WiFi探针探测范围内第n个MAC地址出现的最后一个时刻; 是m号WiFi探针探测范围内第n个MAC地址出现的第一个时刻。
(1)乘客拥堵点停留时间均值及偏差值分布规律分析
本文对总数据中16:00~16:10的自由流时段中提供乘客拥堵点停留时间数据的均值及偏差值进行统计分析,统计结果如图4-5及表4-6所示:
图1统计结果来看,乘客的拥堵点停留时间在100 S以下分布较密集,在100S以上分布较稀少。
从表2统计结果来看,最大值以及最小值与均值之间存在着较大的偏差,说明该时段乘客在拥堵点停留时间时间波动较大。
非正常数据是指wifi探针在信号干扰、乘客手机wifi信号强弱等环境因素的影响下对乘客停留时间的某些预测数据不具备代表性,是不能用以预测当前拥堵点乘客的停留时间。
因此,本文认为采用乘客在拥堵点停留时间的均值作为当前客流状态下的乘客停留时间是不合适的,它很有可能受非常态数据的干扰,使数据结果出现较大偏差。
(2)乘客拥堵点停留间百分位水平值分布规律分析 百分位水平值是指乘客拥堵点停留时间数据中,将低于该值的数据所占的样本频率作为该值的百分位水平,反映了乘客拥堵点停留时间数据中低于该百分位水平值的样本数据的多少。
对总数据提供的乘客拥堵点停留时间数据进行百分位水平统计分析,将停留时间按照从小到大的顺序进行排列,统计可得各百分位水平值(本文仅对10%、20%、30%...90%的数据进行统计分析),统计结果如表3所示:
各百分位水平值数据与乘客拥堵点停留时间样本数据进行偏差值数据分析。研究发现,各个百分位水平值与路段运行时间数据之间的偏差值曲线呈现出极其相似的变化规律:都是从负值变为正值,而且单调增加;各百分位水平路段运行时间与路段运行时间数据样本之间的偏差值序列中,偏差值零点随着百分位水平的增加而增加。
为了更为方便的研究数据的集中程度,本文对乘客拥堵点停留时间与百分位水平值之间选取偏差率指标进行单独的统计分析,偏差率的计算公式如下:
Poffset为乘客拥堵点停留时间与百分位水平值之间的偏差率,Toffset为乘客拥堵点停留时间与百分位水平值之间的偏差值,Tpercentage为乘客拥堵点停留时间百分位水平值。
偏差率反映了公交车辆运行时间与百分位水平值之间的偏离程度,也间接反映出了乘客拥堵点停留时间相对于百分位水平值的聚散程度。
为了方便直接的比较各个百分位水平值的偏差率大小,在偏差率的数据中取均值得到各个各个百分位水平值的平均偏差率,统计结果如表4所示:
表4显示了乘客拥堵点停留时间与10%~90%位水平值的平均偏差率统计分布,研究发现,不同的百分位值的平均偏差率会有变化,说明乘客拥堵点停留时间是围绕着某一水平值呈现上下波动的特性。当选定精度水平后,总可以找到一个最优的百分位水平值,使得偏差率小于该精度水平的样本数量达到最大。根据本次统计的结果显示,当百分位值取80%时,其与样本数据的平均偏差率最小为63%,所以我们可ss以认为本数据中80分位值可以代表该时间段的乘客拥堵点停留时间特征值。
该研究结论为获取某时段内乘客拥堵点停留时间的特征值提供了依据,使得寻找到的百分位水平值更能代表某时段内乘客拥堵点停留时间。
(3)乘客拥堵点停留时间特征总结
通过上述对乘客拥堵点停留时间的深入分析,总结出乘客拥堵点停留时间具有以下几点特征:
(1)乘客拥堵点停留时间在不同的时间段中有比较明显的差异,尤其是高峰时段的客流拥挤状态与非高峰的自由流状态对比下,更为突显这一特征。我们根据此特征来计算在拥挤状态下的乘客在拥堵点上的延误时间。
(2)乘客拥堵点停留时间均值易受非正常数据的影响,而呈现出一定的偏向性,使得采用均值预测乘客拥堵点停留时间的方法产生了不合理的误差。
(3)利用乘客拥堵点停留时间数据进行统计发现,在满足偏差率较小的情况下(偏差率处于60%左右),乘客拥堵点停留时间聚集在80百分位水平的频率相对较高。
上述特征分析为乘客拥堵点延误时间模型的建立提供了数据保障和理论支撑,使得预测模型更符合实际情况。
(4)乘客拥堵点延误时间计算模型
乘客拥堵点延误时间表示的是每个手机MAC地址出现的时间与正常通行状态下的时间的差,通常情况下,取该差值的正数部分。它能实时动态上反映了在轨道车站各个通行设施处由于客流量巨大或者通行设施通行能力有限,导致客流拥堵而产生通行延误现象,其数值也可以很直观地反映客流拥堵的程度或严重性。
在上文,已经计算出该站站台处扶梯口在自由流时段(即16:00-16:10)的乘客拥堵点停留时间特征值其80分位值作为正常通行状态下的乘客堵点停留时间。沿用上文的研究方法,计算出该站站台处扶梯口在高峰拥堵时段(即17:30-17:40)的乘客拥堵点停留时间特征值。
对总数据提供的乘客拥堵点停留时间数据进行百分位水平统计分析,将停留时间按照从小到大的顺序进行排列,统计可得平均值各百分位水平值(本文仅对10%、20%、30%...90%的数据进行统计分析),统计结果如表5所示:
為了方便直接的比较各个百分位水平值的偏差率大小,在偏差率的数据中取均值得到各个各个百分位水平值的平均偏差率,统计结果如表6所示:
根据本次统计的结果显示,当百分位值取80%时,其与样本数据的平均偏差率最小为63%,所以我们可以认为本数据中80分位值可以代表该时间段的乘客拥堵点停留时间特征值。所以,我们得到了该站站台处扶梯口在17:30-17:40的乘客拥堵点停留时间特征值为161s。
根据上文所得到数据,我们将数据代入我们建立的基于wifi探针的乘客拥堵点延误时间的模型中进行计算,公式如下:
T为乘客拥堵点延误时间, 是该站某个拥堵点非正常通行状态下每个手机MAC地址在wifi探针数据中出现的时间长度, 为该站某个拥堵点正常通行状态下的每个手机MAC地址在wifi探针数据中出现的时间长度。
通过上述公式,我们计算出该站台处扶梯口在17:30-17:40的乘客拥堵点延误时间为23s。
4研究结论
随着城市轨道交通的发展以及对轨道交通运营管理服务水平要求的不断提升,实现轨道车站大客流安全风险管理工作的自动化、科学化、高效化,本文通过对基于WIFI探针的轨道车站客流状态指标的研究,得到以下结论:
(1)乘客拥堵点停留时间在不同的时间段中有比较明显的差异,尤其是高峰时段的客流拥挤状态与非高峰的自由流状态对比下,更为突显这一特征。根据此特征来计算在拥挤状态下的乘客在拥堵点上的延误时间具有对客流状态表征的功能。
(2)基于WIFI探针的轨道车站客流参数动态采集和估计方法的研究成果,有助于提高轨道车站大客流下的运营管理服务水平。
参考文献:
[1] P.hoogendoom.Microscopic Simulation of Pedestrian Flows.[C].Annual Meeting at the Transportation Research Board Proceedings on CD-ROM,2003.
[2]李灿.轨道交通枢纽乘客流交通特性分析及建模北京北京交通大学.[D].北京.北京交通大学,007.
[3]沈丽萍,马董,高世廉.城市轨道交通客流分析城市交通.[J].城市交通,2007.4(3):14-19.