论文部分内容阅读
进入新世纪以来,伴随着机动车的城镇保有量和人均拥有量的增长,一系列交通问题显得越发突出。解决城市中的交通问题往往需要以所在城市的交通特征为基础。城市中的出行热点区域是城市中交通量大、居民出行密集的区域,是城市交通的重要特征,因此获得了越来越多的关注。获取居民出行信息的方法一直在不断地发展,从早期的问卷调查到现在比较流行的从大量车租车或公交车的轨迹数据中提取信息,这些方法都存在着一些不足。比如问卷调查数据的时效性较差,出租车数据对城市机动车辆的覆盖性上存在不足。RFID(Radio Frequency Identification)电子车牌数据是城市交通中全体机动车辆的实时出行数据,其优越的数据实时性和对城市机动车辆的覆盖性,使得利用RFID电子车牌数据所获得的城市交通特征更加可靠,更具有说服力。重庆市是RFID电子车牌应用的全国试点城市,全市范围内已经布置了一定规模的RFID采集点,并且立法要求本地车辆必须装配电子车牌。依托于这一条件,本文利用RFID电子车牌数据来挖掘城市热点出行区域,并提出了一整套的方法。在利用RFID电子车牌数据发现城市热点出行区域的过程中,主要存在两个难点:1、RFID轨迹中的停留部分较难识别;2、RFID电子车牌数据的空间分布较为离散、稀疏,不适合用于一般的空间聚类算法来发现热点区域。本文将针对这两个问题展开研究,主要内容包括以下几个方面:(1)将RFID电子车牌数据与轨迹的基本理论相结合,形成了关于RFID轨迹分析的基本理论,为下面章节奠定理论基础。将各条城市道路的等级信息和各RFID采集点的布设位置相结合,形成RFID路段的等级划分,便于在下文相关分析中进行分类讨论。(2)针对RFID轨迹中的停留部分较难识别的问题,本文将建立各RFID路段上的车辆行程时间分布概率模型,然后结合贝叶斯思想判断车辆在某段行程中是否会有停留。本文将RFID路段的行程时间分布看作是以下三种情形中的行程时间分布的联合:⑴快速经过RFID路段⑵在RFID路段上遇到交通拥堵⑶在RFID路段上有停留。然后采用EM(Expectation Maximization)算法计算出每条RFID路段的行程时间分布模型的参数。最后利用各条RFID路段的行程时间分布模型,结合贝叶斯思想来判断RFID轨迹中的每段行程是否有停留,并将判断结果与人工判断的结果相比较,验证该种方法的有效性。(3)针对RFID电子车牌数据不适用于一般空间聚类算法的问题,本文提出了一种基于数据场的热点区域挖掘算法。本文将数据场理论应用到RFID电子车牌数据,建立整个空间各位置对于居民出行吸引力的时空分布模型,并且将吸引力强的区域作为出行热点区域。然后通过可视化方法对不同时段的城市出行热点区域进行展示,并结合城市的POI(Point of Interest)信息对热点区域进行分析。另外,将该结果与利用出租车数据获得的城市出行热点区域进行比较,发现了由不同数据源所得实验结论的异同。