论文部分内容阅读
随着我国区域经济一体化进程的不断加快,机动化水平的不断提高,使得高速公路的交通拥堵与安全问题不断加重。着力于智能交通系统建设成为解决上述问题的有效途径之一。作为保证智能交通系统高效运行的关键部分之一,旅行时间预测近年来得到了国内外学术界的广泛关注,也得到了管理部门的广泛应用。实时、准确的旅行时间预测不仅能够为管理人员提供决策支撑,还可以为出行者提供优质的出行服务。然而目前针对旅行时间预测的研究集中于方法的应用,尚未考虑在智能交通系统中与其他相关部分的协调,没有形成完善的旅行时间预测理论体系,从而制约了整个系统的高效运转。特别是在我国,目前高速公路智能化水平仍然处于发展阶段,现有的信息采集设备、数据处理方法不能够较好地满足旅行时间预测的数据和信息需求。基于此,本论文依托于国家自然科学基金重点国际(地区)合作与交流项目“面向高维多源耦合大数据的多张量网络理论及其实证研究”、交通运输部科技示范工程项目“江苏省高速公路网运营与服务智能化平台科技示范工程”和江苏省交通运输科技项目重大专项“沪宁高速公路超大流量路段通行保障关键技术研究与工程示范”,采用美国和我国的实际交通流数据,从数据采集、数据预处理、数据特征提取和数据建模四个方面着手,开展了高速公路路段旅行时间短时预测方法的研究,构建了一套完善的旅行时间预测理论体系。论文首先介绍各类相关数据的采集方法和匹配方法;其次研究交通流时间序列数据和交通事件面板数据的修复;之后建立交通拥堵检测和交通状态分类模型,并提出了交通拥堵持续时间预测方法;最后为考虑出行者的需求,并提高预测精度,分别构建多步的旅行时间预测模型和考虑外部因素的旅行时间预测模型。从理论层面来看,论文开展的研究有助于认识交通流变量尤其是旅行时间的时空演化规律,掌握交通拥堵产生规律及拥堵持续时间的估计方法,加深理解外部变量对旅行时间变化的影响。从工程应用层面来看,论文的成果有助于提高我国高速公路运营管理的智能化水平,改善高速公路面临的拥堵和安全问题,增强高速公路用户的出行体验,具有重要的工程应用价值。论文的主要研究内容可以概括为以下几个部分:(1)通过归纳现有的国内外相关文献,对高速公路旅行时间预测的相关研究,包括交通流数据的采集、交通状态的识别和交通状态的预测,进行了评述和总结,指出了目前研究中存在的不足。首先,交通信息采集技术仍存在较大的发展空间,旅行时间提取存在一定困难;其次,数据修复的研究集中于单一尺度时空数据的挖掘,对多源数据和面板数据的研究较少;再次,交通拥堵识别研究中的样本问题依旧是面临的难题之一,拥堵持续时间预测建模时如何合理选择多类别变量及异质变量融合的研究不足;最后,旅行时间预测的研究集中于单步预测,缺少对多步旅行时间预测的研究,且在预测建模过程中对外部因素的考虑不够全面。(2)对论文中使用的高速公路多源数据进行了描述与分析。首先,简单介绍了研究中两条高速公路的地理位置及道路特征;其次,介绍了高精度交通流数据、交通事件数据和气象数据的特征,提出了基于新型检测技术的旅行时间提取方法,并对比了两类速度数据的变化特征;最后,介绍了上述各类数据在空间维度和时间维度的匹配方法,阐述了论文后续建模所需数据集的构建。(3)提出了面向旅行时间预测的数据修复方法。首先,分析了交通流参数内嵌的多种时空关联关系,将其总结为全局、局部、时间和空间四个视角,运用长短时记忆神经网络描述全局时间关联关系,利用支持向量机描述全局空间关联关系,针对局部视角,应用了协同关联的方法,并选取核回归方法对多视角的关联关系进行了集成,对交通流缺失数据进行了修正;其次,采用自编码网络模型提取原始交通流参数数据的时空相关关系,得到各类数据的时空特征向量层,并将特征向量进行合并,得到多源数据时空特征向量,基于此,对特征向量进行重构,提出多源数据协同修复方法;最后,将交通事件数据集中的变量分为连续变量和离散变量,提出线性回归模型修正连续变量,提出二分类和多分类logit回归模型修正分类变量。为进一步提高修正模型的稳健性,对传统的多元链式方程进行了改进,克服了其无法获取最终修复数据集的缺陷,提出了多元链式修正模型。(4)提出了高速公路状态识别及拥堵持续时间估计方法。首先,定义了交通事件检测这一二分类问题,总结了以往研究中存在的几个问题:变量筛选问题、小样本和样本不均衡问题和实时性问题。针对变量筛选问题,提出了时间和空间相关变量选择方法;为提高模型的实时性,构建了实时性样本筛选方法,利用筛选的变量和样本构建了基于生成网络的事件数据生成模型,解决了小样本和样本不均衡的难题;基于生成的事件样本,构建了基于堆叠的自编码网络的交通事件检测模型;其次,基于无监督k-means聚类方法和三相交通流理论,提出了交通状态划分方法,通过微波检测器采集的数据对模型进行了测试,并采用摄像机视频数据进行了验证;再次,还构建了基于监督学习神经网络模型的交通状态预测模型,为改进神经网络模型在多分类任务时的性能,提出了ANN-Softmax和ANN-SVM多分类交通状态预测模型;最后,筛选了预测模型的变量,基于受限玻尔兹曼机实现了离散变量的特征提取,基于高斯伯努利受限玻尔兹曼机实现了连续变量的特征提取,并采用连接层实现了特征级融合,构建了可以融合异质变量的受限玻尔兹曼机。以交通事故为例,对模型的参数选择方法进行了说明,并对精度进行了评估。(5)提出了基于参数优化深度学习的旅行时间预测方法。首先,利用时间序列自相关系数和偏自相关系数分析了旅行时间序列的时间相关关系,利用空间相关系数和全局Moran’s I统计量分析了路网各路段旅行时间的空间相关关系,并基于时间和空间相关性分析,提出了变量筛选方法;其次,在传统的Particle Swarm Optimization(PSO)算法基础上,根据专家的经验进行参数预设,进一步加快优化速度;最后,在单步预测的基础上,对PSO算法进行改进,结合多目标问题中的帕累托最优理论,不仅考虑多步预测的精度,而且考虑了多步预测结果的稳健性,提出了多目标PSO算法,对Deep Belief Network(DBN)参数进行优化。模型利用DBN多输出预测架构,改善了传统的逐步迭代算法中的误差不断累积的不足。(6)提出了考虑外部因素影响的旅行时间预测方法。首先,将影响因素分为了两类:突发因素和非突发因素,并采用配对样本检验的方法对两类因素影响的显著性进行了分析,证明了构建旅行时间预测模型时考虑外部因素的必要性;其次,提出了考虑外部因素的旅行时间预测方法,共包括三个部分:变量筛选、预测方法和结果评估。其中,变量筛选部分包括自相关变量筛选和外部变量筛选,前者采用自相关函数完成,后者采用随机森林实现;预测方法部分,论文利用Ensemble Empirical Mode Decomposition(EEMD)方法将复杂的旅行时间序列分解为多个简单的序列,采用随机权神经网络对简单的序列进行预测,然后再将预测结果进行集成,得到最终的预测结果,在此基础上提出了基于分位数回归的预测结果区间估计方法;在结果评估指标部分,除前文提及的点预测评估指标外,还应用了几种常用的预测区间的评估指标。