论文部分内容阅读
随着交通问题的日益突出,国内外专家对城市公共交通方面已经做了较多的研究,但是绝大多数是针对现有交通状况提出改进措施,而对于公共交通规划及运营管理所需的基础资料的获取方法则研究较少。现在我国仍然沿用传统的大规模调查方法,获得数据成本过高且数据质量难以满足要求。随着公交IC卡在国内许多城市的推广使用,基于IC卡数据的数据分析和数据仓库研究有了广泛的操作平台和庞大的数据支持,信息化的客流调查统计手段成为可能,客流信息和运营信息的获得将日趋准确、及时、经济。因此,研究如何从大量的公交IC卡数据中获得公交规划和公交运营管理所需要的客流信息具有重要意义。本文阐述了数据仓库的概念、特点及应用,分析了传统数据库与数据仓库的区别,说明建立公交IC卡数据仓库的必要性及重要意义。文中通过对已有公交数据信息的分析形成公交IC卡数据分析算法总体思路,并应用实际数据对乘客上下车站点进行判断,总结方法优缺点及适用范围。确定了公交IC卡数据仓库结构,给出明确的系统构架,详述IC卡外部数据源预处理过程。最后以长春市为例,完成公交IC卡数据仓库的建立,并调用数据进行公交IC卡数据统计和分析,方法上有一定新意,为进一步的公交IC卡数据挖掘打下基础。