论文部分内容阅读
近年来,我国货车事故发生率以及货车事故造成的死亡率都居高不下,运输过程中的安全问题亟待解决。伴随着车联网大数据的发展,大数据挖掘技术在交通安全领域面临更大的机遇。本文以车联网大数据为背景,将采集的货车轨迹数据、动态数据、预警数据等进行预处理,提取货车出行关键数据,研究货车出行风险特征画像及其关键影响因素,期望能提高货车运输过程中的安全性,预防和减少货车事故的发生。论文主要内容有:(1)车联网货车预警数据的提取、可视化与统计分析。通过对原始记录数据进行清洗与预处理,提取了 932辆京牌车辆,包含发生过预警的车辆716辆和未发生过的预警车辆216辆。运用编程技术实现对目标车辆里程、预警频次、轨迹数据等信息的提取,将提取的GPS轨迹数据进行地图匹配,实现车辆轨迹的可视化。从车辆出行时间和出行距离来看,车辆多是中短距离的出行,从预警分布来看,超速预警较多发生在城际道路上,而疲劳驾驶预警多发生在市内道路上。运用统计分析方法,分析预警频次在不同属性特征下的分布规律,结果表明车辆类型、路段速度、能见度等均对车辆预警发生的频次有显著影响。(2)货车出行风险特征画像。根据驾驶行为数据和车辆运行数据,运用聚类分析判断车辆风险等级,实现对驾驶员的驾驶风险分级,识别出高危驾驶员和安全驾驶员。为了进一步确定驾驶员风险预测模型,根据行驶里程、预警频次等历史驾驶特性数据,建立Bayes判别函数定量分析车辆风险等级和各个参数之间的关系。根据所建立的模型实现对驾驶员驾驶风险的判定和预测,提供某一车辆行驶里程和预警频次就可以实现对该车辆风险等级的判定,将潜在的危险车辆识别出来,降低事故发生率,为交通管理部门加强货车的安全管理提供理论依据。(3)货车危险驾驶行为建模及影响因素分析。运用Python编程和GIS技术实现对高速路段的匹配和车辆提取,以南6环“双源桥”至“马驹桥”高速路段为例,从驾驶员因素、路段因素、环境因素、车辆因素四个方面提取15个变量,构建有序Probit模型(ORP)和SVM模型,探讨影响车辆预警关键因素,模型结果表明牵引车较普通货车更容易发生预警,能见度越差预警可能性越高,低温环境下发生预警可能性更高,凌晨(24:00-06:00)和晚上(18:00-24:00)较其他时段发生预警可能性更大,平均速度和加速度越大危险预警概率越高。两个模型结果对比显示,整体精度SVM优于ORP模型(90.5%VS85.6%)。