论文部分内容阅读
随着城市化进程的不断加快,城市公交系统作为城市重要的交通网络之一,面临着线网规模不断增长、客流动态变化不断增强、乘客出行需求日趋多样等诸多挑战。但一直以来公交行业缺乏有效了解乘客的出行特征以及个体线路选择偏好的手段,难以将乘客出行规律以及偏好特性运用到线网规划调整中。因此,根据公交运营单位采集的乘客出行刷卡记录挖掘其行为模式,分析乘客出行偏好,并随之调整线网及运力配置,对提升公交网络运行效率和服务质量,改善城市居民便利度具有重要的意义。本研究旨在通过多源数据融合修复原始公交运营数据的缺失信息,复现乘客O、T、D时空轨迹,然后从乘客的轨迹片段中挖掘出行模式,最后,用数据挖掘成果结合乘客个体出行轨迹和行为特征对公交线网进行优化。具体研究内容如下:(1)在数据源缺陷修复层面,针对目前我国城市公交数据系统普遍存在的数据缺陷,提出一套在有缺陷数据环境下对一票制公交信息系统的数据进行预处理的方案。主要内容包括了数据采集系统时间误差的校正方法和GPS报站缺失数据的推断方法,一方面,所提供的方法将数据事件转化为离散时间信号序列,然后借助数字信号同步方法找到了数据源间的时间误差,并加以校正;另一方面,结合历史数据和无时间误差的乘客刷卡时间戳,修复缺失的报站数据,最终,得到全体乘客准确的上车刷卡时空轨迹数据集。有效的提升了一票制公交系统的数据质量。(2)在乘客O、T、D出行轨迹复现层面,针对典型下车推断算法无法容忍信息缺失的缺陷,提出了公交乘客完整公交出行信息提取方法。首先在数据存在部分缺失的条件下,引入概率推断、居住地预估计等方法还原乘客的出行时空轨迹。其次,针对传统出行阶段识别算法错误识别乘客短暂活动的缺陷,在时空阈值的基础上提出了改进的出行阶段识别方法。最后,借助完整的O、T、D出行信息数据分析了目标城市公交客流的时变特征与满载率的空间分布特性。(3)在乘客个体出行模式分析层面,针对城市公交乘客出行轨迹碎片化难以分析乘客个体出行模式的现状,提出了基于出行拓扑关系图的新型数据融合方法,从轨迹片段中提取公交乘客的闭合出行链,并分析了乘客的活动特征。首先将个体乘客多天的出行轨迹进行聚类、时空叠加,形成OTD出行拓扑关系图;其次在拓扑关系图的基础上搜索乘客的闭合出行链;再次,建立乘客不闭合出行轨迹集合与闭合出行链之间的内在关联;最后,基于全体乘客的闭合出行链集,从不同层面分析了目标城市的公交乘客出行特征。提出了从公交乘客个体行为分布角度挖掘城市公交客流集散通道的策略。(4)在乘客线路选择偏好挖掘层面,借助乘客出行链数据以及OTD时空轨迹信息构建了乘客的公交出行线路选择偏好模型,并对不同乘客的活动规律进行了研究。首先,借助前序数据挖掘乘客出行链数据以及OTD时空轨迹信息,提取了影响乘客出行线路选择的多个因素,建立了不同服务差异化场景下的乘客出行线路选择偏好模型并进行验证。最后,将乘客按不同的决策敏感因素进行分类,分析了其在工作日与周末的出行规律。(5)最后,在利用乘客行为特征进行线路优化层面,本研究针对目前线路优化方法的不足,提出了一种结合乘客个体出行偏好与公共投入转化率的公交线路优化方法。借助粒子群优化算法与客流分布数据推演得到了不同优化目标下新线的所有可行解;然后,以目标城市典型公交线路为案例,从客流量、乘客出行效率、运力配置等方面讨论并选出最优线路方案;再次,对比了新线加入前后的客流分布以及出行乘客时间效率变化,将乘客个体出行行为数据挖掘以及知识发现的成果应用到公交线路优化中,为城市公交系统的运营调度管理提供决策依据和理论支撑。