论文部分内容阅读
深度高斯过程作为近年来提出的一种新的深度学习方法,由于其强大的学习能力和对非线性数据的隐含细节特征的刻画,被广泛运用于非监督学习领域。与传统机器学习方法或深度学习方法不同,深度高斯过程从单个浅层高斯过程出发,通过使用变分推断的方法,解决了求解最大后验概率分布时的非解析解困境,从而能够在给出预测值的同时,还能从概率意义上刻画预测的不确定性,这种特性在时间序列预测领域中,尤其是在交通流预测中非常具有现实的意义。本文首次将深度高斯过程运用于交通流预测当中,主要工作如下:(1)针对交通流数据的高噪声特性,进行了大量的数据预处理工作,这些工作包括:通过对于各个缺失值填充方法的对比,选择了前向填充作为本文的填充方式;针对数据中的高噪声情况,对比了几个常用的滤波算法,并选择了局部线性加权回归滤波作为最终的去噪手段。(2)搭建了三层的由不同核函数组成的深度高斯网络,对实际数据集中的长期交通流进行了预测,并取得了良好的效果。(3)将深度高斯过程与浅层高斯过程在纵向维度上进行对比,实验证明深度高斯过程在非线性特征拟合程度及预测精度方面,都表现出相比于传统浅层高斯更好的效果,尤其是针对交通流的波动,深度高斯过程能够刻画出传统浅层高斯不能学习到的细节特征。(4)对比了深度高斯过程与经典深度学习网络LSTM之间预测结果的差别,实验发现对于样本内的数据,二者都具备很强的细节刻画能力。而在样本外,深度高斯过程由于其网络结构本身参数稀疏的优势,没有发生传统深度网络容易发生的过拟合现象,因此更加具有鲁棒性。作为一种具有深厚概率背景的机器学习方法,深度高斯过程相比于浅层高斯过程具有更加接近人类思维本质的特性,这在实际预测当中表现为其能够很好地学习交通流数据中多重叠加的非平稳、非线性等特性,并且在取得不错精度的同时,还能够针对预测值的不确定度进行推理,进而推算出预测的置信区间,这种特性使其在时间序列,尤其是在交通流预测领域中,拥有比浅层高斯过程更大的优势。