论文部分内容阅读
空气污染预测在当前城市现代化和大气环境研究中是一个热门方向。如何利用好已观测到的空气污染历史数据,并从中挖掘出有效信息预测污染变化规律,对于污染治理、污染预防和污染预警有着重要意义。能够完整反映气象、排放源已经其它物理化学过程影响的数值预测方法是开展大气污染预测的重要手段。然而,当前空气污染数据分析存在的瓶颈包括:对于大气环境数据的快速高效处理能力存在瓶颈;(2)对于动态模拟污染变化,及各种气象因素之间互影响的过程存在瓶颈。传统基于理论的空气质量预测模型,虽然可以拟合空气污染的过程,但是由于数据维度、初始条件和物理化学参数仍存在极大的不确定性,导致这些传统模型对于空气污染的拟合能力有限。近些年,人工智能算法在图像和自然语言处理方面取得成功,这为大气污染分析预测提供新的思路和方法。深度学习是当前发展最为活跃的智能算法之一。深度学习有着大量的神经元,拥有强大的数据拟合能力。深度学习算法可以从丰富、海量的空气污染大数据中提取特征和规律,深层次揭示污染物之间、污染物和气象环境之间的深层次关联关系,实现更为精确的预测效果。深度学习技术为空气污染数据分析带来如下机遇:(1)基于神经网络的深层次特征分析;(2)基于多维数据的时序关联分析;基于上述考虑,本论文引入深度学习技术,充分发挥深度学习在大数据处理方面的优势,研究智能算法在环境科学领域中的交叉应用。本论文首先提出一个基于深度学习的空气污染物预测模型,然后从不同方面改进这一模型,以期达到更好的预测结果。对此,本文主要内容如下:(1)空气污染物浓度时序预测方法研究。本文提出了一个基于自编码神经网络的污染物浓度预测模型RASP(RLSTM and Attention sequence Prediction)。该模型包括两个部分:编码器(Encoder)和解码器(Decoder)。其中,编码器用于提取出时间序列污染物浓度数据分布特征;解码器利用提取的特征预测未知时间内污染物浓度数据。模型中编码器和解码器采用多层循环神经网络结构,实现长时间依赖的预测目标。同时,本文尝试改进循环神经网络方法,提出基于长短期记忆(LSTM)的新型循环神经网络,用以提升RASP模型的性能。(2)基于注意力机制的时序预测方法研究。本文认为不同时刻空气污染观测值不仅存在着影响,而且影响力也各不相同。因此,预测空气污染浓度需要有侧重地关注前面一个或多个时刻的空气观测值。在RASP模型的基础上,本文提出了基于注意力机制的模型,计算不同时刻的影响力,较多关注那些对后续时刻影响大的时刻,并将这些关注点融入到后续时刻的预测中。论文通过仿真实验证明,相比于传统的空气预测模型,本文提出的RASP模型可以提升空气污染预测的准确度,并且保持比较好的灵活性。同时,虽然复杂度有所提升,基于注意力机制的RASP模型可以进一步提升污染预测的水平。