论文部分内容阅读
交通事故每年都会造成巨大的人员伤亡和财产损失,道路交通安全问题日益受到社会各界的关注。通过对事故数据深入分析,挖掘事故发生规律,进而为制定安全应对措施提供决策依据,是提升交通安全水平最直接和有效的手段,而合理的分析和建模方法是基础和前提。对传统模型进行改进和优化,不仅能提高分析的准确性,还能从有限的数据中获取更多有价值的交通安全信息,即通过优化分析方法达到提升安全水平的目的,一直都是交通安全分析方法论中最重要的分支之一,具有持续的研究空间及广泛的应用前景。
建模数据的异质性和内生性是影响模型可靠性的最根本因素,同时也是易被忽略的因素。本文从刻画异质性和控制内生性角度出发,对传统固定参数模型改进及其改进模型在我国高速公路安全分析中的应用等进行了研究。
首先,从事故次数模型、异质性及内生性、事故影响因素三方面对国内外研究现状进行了评述,重点分析了计数模型在道路交通安全中的应用,总结了现有的研究成果,并分析了各类模型的优势和存在的问题。基于此,分析了数据异质性和内生性对模型可靠性的影响,据此提出了模型改进方向和优化方法。
其次,结合国内8条高速公路事故、交通运行、道路设计及天气条件数据,在同质法路段划分基础上,基于事故积分函数确定了路段长度的合理范围;基于Cook距离识别出了异常样本并给出了异常样本处理方法;采用皮尔逊相关系数、克莱姆相关系数及组内相关系数检测了建模变量的共线性及自相关性。
而后,从事故产生及统计分布角度出发,阐述了事故发生的泊松过程;基于事故数据的过离散性,构建了负二项模型;针对零事故样本较多的情况,给出了零堆积泊松和零堆积负二项模型的建模原理;最终,从事故发生原理、模型拟合优度及预测精度等方面综合确定了事故次数服从的分布形式。
再次,鉴于传统的固定参数模型难以刻画数据异质性的局限性,提出了将参数随机化的模型改进方法。基于过离散参数在各样本分组中随机变化的事实,构造了随机效应负二项模型;基于事故影响因素在各样本上对安全的影响并非固定不变的假设,提出了基于自变量参数随机变化的随机参数负二项模型。给出了两种模型的参数估计方法,并从拟合角度对模型进行了优选。为进一步考虑异质性对事故发生的交互影响,将随机项系数对角矩阵设置为各元素任意取值的自由矩阵,从而又构建了相关随机参数负二项模型,并给出了基于累计残差分布的模型拟合效果评价方法。
最后,在刻画数据异质性基础上,进一步提出了通过样本匹配控制内生性的方法。提出了基于倾向值的样本匹配原理和过程,给出了倾向值模型的构建过程以及基于倾向值的邻近匹配法、马氏匹配法及遗传匹配法的样本匹配方法;利用匹配样本构建了相关随机参数模型以控制数据内生性对建模的不利影响。
将本文构建的随机参数模型、相关随机参数模型以及基于匹配样本的相关随机参数模型分别应用至高速公路基本路段、隧道路段及爬坡路段的安全分析中。结果表明:高速公路事故次数服从负二项分布,而零堆积模型难以符合事故发生的逻辑过程,宜慎重使用;随机效应负二项模型和随机参数负二项模型均能刻画数据异质性,但后者的拟合效果胜过前者;相关随机参数模型能进一步反映异质性间的相关性,因而具有更佳的拟合优度并能获得更多的安全分析推论;基于倾向值匹配样本的随机参数模型能同时控制数据异质性和内生性对模型可靠性的影响。利用所建模型,鉴别出了28个对高速公路事故有显著影响的因素;得到了12个对隧道安全性有显著影响的因素,以及各因素对事故的交互影响规律;推断出设置爬坡车道可降低重型车比例及连续上坡长度对行车安全的不利影响并可使事故率降低17%左右。
研究成果一方面证明了采用随机参数模型控制数据异质性和内生性的可行性和有效性,为传统模型的改进提供了新思路和方法,丰富了现有的事故分析理论体系;另一方面,改进模型可应用至实际道路安全分析中,有助于制定针对性的交通安全应对策略,提高道路设计、管理及运行安全水平。
建模数据的异质性和内生性是影响模型可靠性的最根本因素,同时也是易被忽略的因素。本文从刻画异质性和控制内生性角度出发,对传统固定参数模型改进及其改进模型在我国高速公路安全分析中的应用等进行了研究。
首先,从事故次数模型、异质性及内生性、事故影响因素三方面对国内外研究现状进行了评述,重点分析了计数模型在道路交通安全中的应用,总结了现有的研究成果,并分析了各类模型的优势和存在的问题。基于此,分析了数据异质性和内生性对模型可靠性的影响,据此提出了模型改进方向和优化方法。
其次,结合国内8条高速公路事故、交通运行、道路设计及天气条件数据,在同质法路段划分基础上,基于事故积分函数确定了路段长度的合理范围;基于Cook距离识别出了异常样本并给出了异常样本处理方法;采用皮尔逊相关系数、克莱姆相关系数及组内相关系数检测了建模变量的共线性及自相关性。
而后,从事故产生及统计分布角度出发,阐述了事故发生的泊松过程;基于事故数据的过离散性,构建了负二项模型;针对零事故样本较多的情况,给出了零堆积泊松和零堆积负二项模型的建模原理;最终,从事故发生原理、模型拟合优度及预测精度等方面综合确定了事故次数服从的分布形式。
再次,鉴于传统的固定参数模型难以刻画数据异质性的局限性,提出了将参数随机化的模型改进方法。基于过离散参数在各样本分组中随机变化的事实,构造了随机效应负二项模型;基于事故影响因素在各样本上对安全的影响并非固定不变的假设,提出了基于自变量参数随机变化的随机参数负二项模型。给出了两种模型的参数估计方法,并从拟合角度对模型进行了优选。为进一步考虑异质性对事故发生的交互影响,将随机项系数对角矩阵设置为各元素任意取值的自由矩阵,从而又构建了相关随机参数负二项模型,并给出了基于累计残差分布的模型拟合效果评价方法。
最后,在刻画数据异质性基础上,进一步提出了通过样本匹配控制内生性的方法。提出了基于倾向值的样本匹配原理和过程,给出了倾向值模型的构建过程以及基于倾向值的邻近匹配法、马氏匹配法及遗传匹配法的样本匹配方法;利用匹配样本构建了相关随机参数模型以控制数据内生性对建模的不利影响。
将本文构建的随机参数模型、相关随机参数模型以及基于匹配样本的相关随机参数模型分别应用至高速公路基本路段、隧道路段及爬坡路段的安全分析中。结果表明:高速公路事故次数服从负二项分布,而零堆积模型难以符合事故发生的逻辑过程,宜慎重使用;随机效应负二项模型和随机参数负二项模型均能刻画数据异质性,但后者的拟合效果胜过前者;相关随机参数模型能进一步反映异质性间的相关性,因而具有更佳的拟合优度并能获得更多的安全分析推论;基于倾向值匹配样本的随机参数模型能同时控制数据异质性和内生性对模型可靠性的影响。利用所建模型,鉴别出了28个对高速公路事故有显著影响的因素;得到了12个对隧道安全性有显著影响的因素,以及各因素对事故的交互影响规律;推断出设置爬坡车道可降低重型车比例及连续上坡长度对行车安全的不利影响并可使事故率降低17%左右。
研究成果一方面证明了采用随机参数模型控制数据异质性和内生性的可行性和有效性,为传统模型的改进提供了新思路和方法,丰富了现有的事故分析理论体系;另一方面,改进模型可应用至实际道路安全分析中,有助于制定针对性的交通安全应对策略,提高道路设计、管理及运行安全水平。