论文部分内容阅读
重污染天气频发给人们的生活和健康造成了严重的危害。对空气质量及时准确的预测,不仅可以帮助人们提前了解未来空气状况,而且能够在重污染天气发生前提供预警,以便环保部门采取应急响应,防控或减缓危害的发生。空气质量预测具有很强的现实意义,但目前的预测精度仍有待提高。神经网络已被证明可用于序列数据预测问题中,但截止目前,深度学习在空气质量预测领域的应用研究较少,已有工作在选择模型时很少考虑到空气质量的时空特性,而且在确定网络超参数时大多选用经验法和试凑法。为了解决以上问题,本文以网络结构、超参数选取、模型输入作为研究的三个切入点,先后提出了两种空气质量预测模型:针对现有空气质量预测方法精度偏低、对噪声敏感等问题,我们提出了第一种空气质量预测模型:基于堆栈降噪自编码网络(Stacked Denoising Auto-Encoders,SDAE)和网格搜索的预测模型SDAE-GS。首先以武汉市历史空气质量和气象监测数据为研究对象,建立SDAE模型逐层学习原始数据的特征表达,并将最后一层特征与BP网络连接完成预测模型的调优;接下来我们设计一种多维网格二次搜索法进行超参数寻优并在测试集上进行预测,选用预测值与实际值之间的平均绝对误差、均方根误差、平均绝对百分误差等指标作为预测性能评价标准,通过与其他网络模型的实验对比,证明了 SDAE模型对于空气质量等级具有较优的预测性能;最后从时间、空间、时空三个角度对该模型输入进行优化,实验结果表明基于空间优化的SDAE-GS模型预测性能提升最为明显,能够得到比传统方法更加精确的预测结果。由于第一种模型存在无法从时间角度建模的局限性,我们设计了第二种空气质量预测模型:基于长短期记忆网络(Long-Short Term Memory,LSTM)和烟花算法(Fireworks Algorithm,FWA)的预测模型 LSTM-FWA。首先,利用 LSTM 网络中隐含层节点之间相互连接的结构特点,对空气质量的时间变化特征进行建模;接下来,使用群体智能算法对超参数寻优进行改进,考虑到种群多样性和并发性,提出将烟花算法应用到超参数组合优化问题中;最后对模型输入分别进行时间、空间、时空角度的优化,实验结果表明基于时空优化和时间优化的LSTM-FWA模型预测性能提升更为明显。完成以上工作后,我们对本文建立的两种空气质量预测模型SDAE-GS和LSTM-FWA进行了比较,全面分析了两种模型在各种优化策略下的性能,实验结果显示,时空优化策略下的LSTM-FWA对于空气质量具有更优的预测性能。