论文部分内容阅读
公交出行是城市公共交通服务体系的主体部分,其出行特征数据是公交规划与设计、公交线网服务评价及优化、公交调度等措施实施的基础资料。传统的公交数据需要通过大规模的居民出行调查获取,不仅耗费了大量的人力、物力以及财力,且得到的数据时效性差,数据后期的整理工作量大、成本高,不能及时准确的为公交管理部门提供数据支持。智能公交系统集成了现代的通信、计算机、智能控制等先进的技术,公交系统的调度、运营以及公交乘客的刷卡信息中积累了海量数据,这些数据不仅记录了公交车辆的运行轨迹,而且潜藏着公交乘客的出行信息,为公交出行特征数据的提取及分析提供了良好的数据环境。本论文在对公交大数据分析技术研究现状总结分析的基础上,以公交IC卡数据、公交GPS定位数据、公交线路基础数据及站点坐标数据为基础,完成了公交上车、换乘及下车的判断;结合居民的出行目的及刷卡特征,以完成一个出行目的的一次或由换乘连接的多次刷卡作为同一条公交出行链,对“公共交通出行链”进行了定义,在明确出行链构建规则及数据源结构的基础上,提出并构建了海量公交出行链数据库,为公交出行特征分析提供数据支持,在公交大数据准备及海量公交出行链数据库的基础上,根据需求目标构建基于公交大数据环境的公交出行特征分析体系;提出了基于SQL查询的公交出行特征分析方法,该方法是在SQL数据库中采用查询语句的方法对公交刷卡数据、公交出行链数据以及公交出行时间、空间分布特征进行分析;将多维数据分析技术应用于公交大数据的分析,构建了公交多维数据模型,并提出基于公交多维数据模型分析出行特征的方法,该方法从时间、空间、乘客及乘车行为四个维度对公交出行特征进行分析;采用数据挖掘技术,对公交乘客在不同模式下的出行时间进行了聚类,挖掘其中的分布规律,同时采用时序挖掘算法对公交系统的客流量进行预测,并对其预测精度进行分析。论文详细构建了每种分析方法下数据的提取规则及算法流程,并完成了公交出行特征分析体系的构建,采用可视化的图表分析方法,完成了不同目标下出行特征的分析。实现了系统提取公交出行特征数据的目标,以某市15日的公交数据为例,对该市居民的公交出行特征进行了系统全面的分析,表明论文中提出的分析方法及分析体系具有良好的适用性,能为公交线网的规划、公交公司车辆的调度、公交运营能力的提高及公交服务水平的改善提供针对性的数据支持。