论文部分内容阅读
随着我国经济的急速发展,城市堵车现象日益严重,倡导公民采用公交出行,是缓解这个问题的最好方法。目前,乘客IC刷卡数据大量积累,通过IC刷卡数据研究乘客出行时的行为规律,可以为城市建设、公共交通系统发展提供有效信息。但是,公交IC刷卡数据中仅存储了乘客乘坐公交车时的刷卡时间等信息,数据严重残缺。针对这一问题,本文通过深入挖掘研究重庆市公民公交出行的行为习惯,对乘客上下车站点识别、线路站点客流特性展开深入研究。本文的主要工作内容如下:第一,针对基于换乘行为的上车站点识别算法存在的问题,本文通过分析挖掘乘客使用IC卡出行时的行为规律,对算法进行改进,提出基于乘客行为的上车站点识别算法。首先,针对公交换乘时两个公交线路存在多个相交站点所导致的乘客组的上车站点识别数量少的问题,本算法先通过地铁-公交换乘信息,识别部分乘客组的上车站点,并将刷卡记录和公交站点切分为多个子段,在各个子段中,根据时序关系筛选乘客公交换乘的候选上车站点,进而得到公交换乘乘客组的上车站点。其次,针对早高峰及早高峰之前时段中乘客换乘信息较少,无法有效识别乘客上车站点的问题,本文研究多个工作日中IC卡忠诚用户在该时段的乘车习惯,通过条件筛选,找到IC卡忠诚用户在该时段乘坐目标线路时的上车站点,进而识别其他乘客的上车站点。第二,针对基于概率的下车站点识别算法在计算站点吸引系数时存在的问题,本文以公交站点为研究对象,提出基于大数据的下车站点识别算法。在现有算法的基础上,本文从站点的客流分时段特征、多个工作日站点累计发生量这两个因素上,改进站点吸引系数的计算方法,得到更为客观稳定的站点吸引系数,计算公交线路各站点的客流量和客流特性。本文采用重庆市公共交通大数据,从站点识别准确率和平均相对误差方面对本文所提出的算法与改进前算法进行比较和分析,实验表明,本文提出的算法在识别上下车站点方面具有更好的性能。