论文部分内容阅读
交通拥堵分为常发性的交通拥堵和偶发性的交通拥堵。交通事故是引起偶发性交通拥堵的一个重要原因。在常发性的交通拥堵中,道路交通中心可以通过分析历史数据为驾驶员提供有用的信息,日常出行者自身也会对常发性的交通拥堵有所估计。对于偶发性的拥堵,驾驶员无法获取有关道路上交通流状况的有效信息,准确的预测交通事故持续时间,并且及时的传递给道路上的驾驶员就具有十分重要的意义。本文基于北京市122报警系统收集到的62941组历史数据,综合运用多元线性回归、数据挖掘、离散选择模型等多方面的基础理论与方法,力求建立起能够准确预测交通事故持续时间的模型,并运用另外的8000组数据进行了误差分析。首先,本文将交通事故的特性变量和交通事故的持续时间进行回归,最终得到交通事故持续时间与特性变量之间的回归模型,当新的交通事故发生之后,利用收集到的交通事故的特性信息,回归模型可以计算出该交通事故的持续时间。8000组数据的预测结果显示,回归模型的预测误差为31.4%。。其次,本文将数据挖掘中的决策树方法应用于交通事故持续时间的预测方面,建立了基于CHAID(Chi-squared Automatic Interaction Detector)和CART(Classification and regression tree)树的交通事故持续时间预测模型。8000组数据的预测结果显示,基于CHAID树的预测误差为30.8%,基于CART树的预测误差为29.5%。再次,本文将离散选择模型应用于交通事故的持续时间预测中,选用了多元Logit和顺序Probit两种方法分别建立了交通事故持续时间的预测模型。8000组数据的预测结果分别为27.26%和30.89%。由于上述模型在不同的环路和放射线上预测精度各有差异,本文最后运用层次分析的方法将上面所述的三种方法纳入整个预测体系中,比较不同预测方法的误差,并建立判断矩阵,计算相应的赋权向量,并给出预测值。8000组数据的预测误差为26.4%,结果表明层次分析模型提高了预测模型的精度。