论文部分内容阅读
信息技术的飞速发展为交通研究和城市交通管理带来了海量的交通数据。特别是近些年在智能交通研究领域,将交通大数据应用于交通流预测和数据分析处理已成为当下研究的热点。通过机器学习的方法对交通场景建模,能够有效的利用交通数据,反映出交通模型的特征。将数据驱动的建模方法与传统交通流理论相结合,能使提高数据的使用效率和数据质量,使得所建立的系统模型更接近实际交通场景,提升模型对交通流数据分析预测的精确度和准确性。本文设计了三种对交通场景建模及数据处理的算法:ARIMA模型(Autoregressive Integrated Moving Average model),基于贝叶斯组合方法的高阶多元马尔可夫模型和基于EM算法的高斯混合模型。针对以上三种模型,取得了以下研究成果:(1)通过ARIMA模型对高速公路交通流进行研究,用自回归移动平均过程对速度的短期变化趋势进行建模。该模型简化了数据分析过程,能够迅速获得对速度的短时预测结果。仿真结果表明,该模型能够准确合理地对交通速度进行短时预测。(2)提出了一种基于高阶多元马尔可夫模型与贝叶斯组合方法的数据融合算法。该算法模型通过多种数据源来提高数据质量,以获得相比单一数据源更好的数据。该算法是一种通用的异构多数据源的融合算法,通过贝叶斯组合方法融合实现,并通过高阶多元马尔可夫模型建立数据源中不同交通变量的转移概率关系,从而获得更准确合理的融合数据结果。并且使用三种数据源(包括Loop数据,INRIX数据,NPMRDS数据)进行验证。仿真结果表明,该方案能够有效地提升数据质量和准确度。(3)提出了一个新型变量,即环境影响因子,该变量通过基于EM算法的高斯混合分布模型对隐藏数据进行挖掘获得。通过对该变量隐藏数据的挖掘,建立了交通变量之间的隐藏链接关系,反映出了交通场景的隐藏特性。引入环境影响因子后,优化了基于高阶多元马尔可夫模型的交通变量预测算法。仿真结果验证了环境影响因子的有效性和合理性,并通过合理的分类获得更高精度的交通速度预测结果。最后,总结了全文工作成果和尚存的不足之处,并展望了后续的研究工作。