论文部分内容阅读
交通需求的持续增长使得交通拥堵、环境污染、交通安全等问题日趋严重。如何运用科学的方法准确认知交通物理系统的演化规律,对现有路网资源进行优化配置,提高现有道路资源的利用效率,为缓解交通拥堵等问题已成为目前亟待解决的问题。信息物理系统(Cyber Physical Systems,CPS)的提出及应用为解决交通系统中存在的问题提供了新思路。将CPS技术应用于交通系统,一方面,可以广域多维地获悉表征交通物理系统实时状态的信息,为获悉交通物理系统实时状态和运行规律提供了重要的信息来源;另一方面,通过对所获取的海量交通数据的及时分析和有效处理,进而为交通物理系统的全面协调和实时优化提供新的依据。 将大量的感知设备布设于道路交通系统中用以实时监控道路交通状态,进而获取表征交通物理系统的实时状态信息,通过分析这些信息并将处理结果反馈于交通物理系统中,进而实现交通物理系统的实时协调和全面优化,体现了CPS的典型特征。在交通物理系统中,由GPS、RFID、感应线圈等不同感知设备所产生的交通数据以流的形式不断涌现。通过对监控道路交通实时状态的交通流式数据的分析,不仅可以对道路交通状态进行评价和预测,还可以解析交通状态演变的机理、掌握交通物理系统的运行规律。 本文通过对交通流式数据的特点及特性的分析,在现存的流式数据聚类方法研究的基础上,研究表征交通物理系统状态广域多维的交通多流式数据的聚类分析及交通多流式数据的演化趋势发现方法。 论文的主要工作如下: ①从CPS的角度,分析交通流式数据的特点及特性。 为探索基于CPS的交通流式数据的分析及处理方法,对表征道路交通状态的常用参数进行了描述,总结了交通流式数据的特点。基于固定检测器所采集的道路实时状态信息,对交通流式数据的周期演化和纵向传播特性进行分析。 ②为发现交通多流式数据之间的关联关系,结合交通流式数据的周期演化特性,提出交通多流式数据的进化聚类分析方法。 为解决交通多流式数据聚类时的高维问题,受启发于联合聚类以及基于矩阵分解聚类的思想,提出了基于低秩近似矩阵分解的多流式数据进化聚类算法EC-NMF。 首先,EC-NMF算法充分利用流形与低秩结构来学习非负数据的有效表示,分别在数据空间和特征空间中构建基于近邻的数据图和特征图来反映它们各自的几何流形结构。为保持聚类结果随时间变化的平滑性,EC-NMF算法考虑了随时间滑动的历史聚类结果的信息。其次,推导出了EC-NMF模型的交替迭代更新规则,并从理论上证明了EC-NMF模型的收敛性和正确性。最后,基于合成和实测数据集对所提出的EC-NMF算法进行了相关验证。 ③结合具有上下游关系的交通流式数据之间的纵向空间传播特性,基于联合聚类多个相关类型数据的研究现状,提出了交通多流式数据的联合聚类算法。 首先,为能够更客观地分析多交通流式数据之间的关联关系,结合交通系统中流式数据随空间演化的纵向传播特性分析,提出基于非负矩阵三分解的交通多流式数据联合聚类框架 STClu。其次,给出了 STClu模型的交替迭代更新规则。最后,基于合成和实测数据集对STClu算法进行了实验验证。 ④为揭示交通流式数据之间随时空的演化特性,进一步获悉多个相似断面之间的交通状态随时间演化的特性,提出了基于聚类思想的交通多流式数据演化趋势发现方法。 首先,将以单条流式数据为单位的聚类问题转化为多流式数据的图聚类模型。根据交通流式数据之间的滞后相关性特征,给出了基于滑动窗口的交通流式数据的滞后相关性计算方法。其次,基于谱图理论的相关思想,提出了基于滞后相关的交通多流式数据的聚类算法ICMDS。为通过分析不同时刻交通多流式数据的聚类结果,获悉交通流式数据的演化趋势,提出了基于ICMDS算法的交通多流式数据演化趋势发现算法 TEEMA。最后,基于合成和实测数据集分别验证了 ICMDS算法的有效性和TEEMA算法的可扩展性。 综上所述,本文深入地研究了流式数据的聚类分析方法,详细地分析了基于CPS的交通流式数据的特点及随时空演化的周期和纵向传播特性,提出了更符合交通实际的交通多流式数据聚类分析及演化趋势发现方法,并从理论分析和仿真实验验证两方面对上述工作进行了验证。