基于大数据与机器学习的公交客流预测与行车优化模型研究

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:buffon149
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着大数据技术与机器学习方法的兴起,以用户的个人出行行为为核心,融合大数据与机器学习方法,从非集计的角度深入了解用户的交通需求受到了学者们的广泛关注。机器学习方法与传统统计方法相比,更能提高采样的范围,揭示用户数据之间的内在联系;从非集计的角度出发,能够更好的掌握用户的出行规律与出行特征,了解交通需求的差异性,为乘客设计符合其需求的公交方案。大数据及机器学习算法为公交运营带来了新的挑战与机遇,本文以大数据与机器学习算法为切入点,提出了公交的乘客出行特征分析方法、建立了公交线路站点客流量预测模型、设计了基于预测数据的公交行车方案。具体内容如下:(1)公共交通乘客出行特征分析。本文从用户个人交通行为出发,分析了乘客的交通出行特征。在此过程中,将乘客的公交卡数据进行出行重构,形成乘客出行的完整出行链。运用基于密度与噪声的聚类算法(DBSCAN)分析了公交乘客的时空出行规律,并将乘客分为规律出行乘客与非规律出行乘客两大类。针对这两类乘客,具体分析了他们出行的时间与空间偏好。为观察非集计乘客交通行为的聚集效果,本文提出了基于节点重要度的公交站点聚类方法,将公交站点进行聚类形成无交集区域,分析了典型区域的客流特征与区域之间的客流联系。(2)公交站点客流量预测。为满足多线路与单线路公交客流预测的不同需求,本文基于机器学习中的X推进树(Xgboost)算法与长短时记忆网络(LSTM)算法,分别提出了多线路客流预测模型与单线路高精度客流预测模型。多线路客流预测模型为融合兴趣点数据的Xgboost客流预测模型(XPPM-POI)。多线路客流预测要求模型在精度以及效率之间进行平衡,即在能够接受的时间范围内进行模型的建模以及迭代。因此本文选择Xgboost作为多线路客流预测的核心算法以加快模型的训练速度,并将兴趣点数据加入到模型中提高数据维度,增加模型的准确性。对于单线路客流预测问题,在进行乘客出行规律分析后进一步提出了考虑兴趣点乘客出行特征的LSTM客流预测模型(LPPM-TC)。单线路客流预测由于输入的数据量较少,因此主要以提高预测精度为目标,因此本文选择了能够考虑之前数据对预测数据影响的长短时记忆网络模型作为核心算法。为提高预测精度LPPM-TC模型除使用兴趣点数据外,还通过对乘客进行分组的方法,扩充了所求参数数量,提高模型的准确度。因此,LPPM-TC模型的组织更复杂,适用于单线路客流预测,而XPPM-POI模型组织相对简单,能够满足多线路的客流预测准确性以及效率的需求。本文通过与历史均值模型以及支持向量机(SVM)等模型的对比,验证了所提出模型的优秀性能,并分析了不同模型在客流数据预测上的优缺点。在XPPM-POI模型训练的过程中,标定了公交站点为周围兴趣点的最佳查询半径并计算了不同类型的兴趣点对于XPPM-POI的影响。(3)公交行车方案设计。在实际生产生活中,公交公司通常要设计不同的运营计划,在大数据以及机器学习算法的帮助下,实时进行公交计划的设计与快速变更成为了可能,因此本文应用大数据技术与机器学习算法对较复杂的换乘协调问题及区间车问题进行了深入研究。基于本文提出的客流预测模型,分别建立了实时换乘协调公交运营组织(RTTBO)模型以及多周期区间车公交运营组织(MPSBO)模型。RTTBO模型以XPPM-POI模型为数据输入,能够实时进行多条线路乘客数量的预测,通过建立乘客出行概率网络实时更新换乘乘客数量,以换乘协调为目的进行实时换乘协调计划的更新。模型包括客流量预测、乘客换成概率预测、通行时间计算以及最优化模型四个部分,客流量预测部分以XPPM-POI模型为基础,乘客换乘概率预测部分建立了计算乘客换乘概率的神经网络(ANTPP)模型,达到实时获取换乘乘客数量的目的,通行时间计算以历史均值模型为基础,最优化部分则是以公交线路的总成本最低以及乘客总出行时间最小为目标建立多目标优化模型。MPSBO模型则以设计不同周期的区间车计划为目的,能够为不同周期的公交计划产生不同的区间车方案。该模型以LPPM-TC模型为输入,能够输出包括月计划、周计划与小时计划三种周期的区间车计划。每种计划包括,以LPPM-TC模型为基础的客流量预测部分,以历史均值模型为基础的通行时间计算部分,以及以最优化为基础的发车方案设计部分。为求解不同MPSBO模型以及RTTBO模型,本文分别设计了考虑法定发车间隔的最优化模型快速解法以及考虑不同优化目标权重模型的遗传算法,寻找公交运营组织优化问题的最优解。通过与现有计划以及现有研究方法的对比,验证了MPSBO模型以及RTTBO模型的优越性。
其他文献
目的:分析下肢创伤后患者并发深静脉血栓的临床特征。方法:收治下肢创伤后并发深静脉血栓患者60例,分为A组和B组,各30例。A组给予一般治疗,B组给予综合治疗。结果:B组患者症
有机肥由于吸水性较强,在存储过程中易潮解、粘连结块,导致含水率增加,从而影响施肥机的排肥性能。为了探明有机肥含水率对施肥机排肥性能造成的影响,对不同含水率有机肥物理
会议
本报讯 近日,潜山县乡村旅游捷报频传,继天柱山镇、水吼镇之后,塔畈乡又被评为“安徽省最佳旅游乡镇”;卧龙山庄、卓锡山庄、宋板桥民居,继查冲生态园、白马潭之后又被评为四星级
报纸
目的:门诊是医院工作的前沿,是患者接触最先的诊疗场所,体现了医院的整体形象,同时又是联系社会与医院的重要枢纽。对门诊量及其变化趋势和规律进行准确预测对于门诊的管理与
"科研诚信范式"是在批判继承"默顿范式"、"科研过程诚信"以及美国国会CRI相关思想基础上而得以确立的。作为一种培育负责任研究行为的伦理文化环境,科研诚信具有科学家个体与
会计证是进入会计岗位的准入证,而根据国务院常务会议精神和《国务院关于取消一批职业资格许可和认定事项的决定》,会计从业资格被列为建议取消的职业资格事项,因取消会计从
访谈对象:山东省济宁市兖州区人民法院院长 张瑞山$$ 新常态应有新思路$$ 法周刊:你院是如何认识司法公开适应新常态的重要意义的?$$ 张瑞山:司法公开是适应法院工作新
报纸
国债期货具有规避利率风险和价格发现等基础功能,完善的国债期货市场能.够为市场主体提供高效率的利率风险管理工具,并增强实体经济抵御利率风险的能力,提升一国金融体系总体
<正> 马克思主义人学是人学理论宝库中的重大创新性成果。马克思主义人学在超越以往人学理论的过程中,主要实现了三重转向,即从抽象的人到现实的人的人学研究对象的转向,从单