论文部分内容阅读
近年来,随着通信网络技术的不断发展,网络流量的需求也日益增多。网络流量模型和预测在分析实际网络流量和网络性能方面起着重要作用。通过足够准确的预测,可以提高网络利用率和性能。网络流量具有随机性和非线性。传统的线性模型,对于网络流量的随机性和非线性难以刻画,使得其预测结果有较大局限性。随着机器学习及深度学习技术的发展,更多的预测模型可以应用到流量预测问题中。然而,由于流量复杂的动态时空相关性以及多小时长期流量预测的复杂性,网络流量的精准预测仍十分困难。因此,如何对网络流量进行单步和多步精准预测是本文研究的关键问题。针对单步网络流量预测,现有模型或者仅考虑时间序列的时间特性,而忽略了区域间的空间相关性;或者使用CNN对空间相关性进行提取,要求数据集必须按标准网格形式划分,限制了使用场景。为了同时获取网络流量在空间和时间的复杂相关关系并且使模型能够更广泛地应用,本文提出了一种基于改进时空多层级注意力机制和长短期记忆网络(Long Short-Term Memory,LSTM)的蜂窝网络流量单步预测模型STA-LSTM(Spatial Temporal Attention LSTM)。本文首先使用空间注意力机制,以增强编码器学习地理上各区域信息空间相关性的能力。然后采用时间注意力机制来自适应地选择相关的时间步信息进行辅助预测。在实际数据集上的实验结果表明,STA-LSTM能够高效地获取网络流量数据的时空相关关系,降低预测误差。同时由于模型无需数据集按标准网格形式划分,使STA-LSTM模型可以更广泛地适用于多种流量数据集。然而现实中很多情况需要对网络进行多步提前预测,以科学规划网络资源。此时需要使用多步流量预测模型。但如何减少多步流量预测的累计误差,一直是一个难点。本文针对多步预测现有误差积累问题,分析了现有方法的效果,最终使用计划取样(Scheduled Sampling)的训练方式减少训练中使用真实值与测试时使用预测值之间的不匹配问题,有效地降低了累计误差。另外针对长期记忆能力不足的问题,本文通过将过去的细胞状态选择性地加入到当前细胞状态中,帮助模型记忆更长时间段的信息来改进LSTM结构,以进行多步和长期流量预测。最终形成STAL-LSTM(Spatial Temporal Attention Long-term LSTM)模型,实验表明,STAL-LSTM模型可以降低多步预测的误差,当预测步数越多的时候提升效果更加明显。综上所述,针对网络流量预测问题,本文在单步预测和多步预测两方面分别进行了研究和改进,所提出的模型能够提升整体预测准确性。