论文部分内容阅读
大气降水是地表淡水的主要来源之一,许多地区的降水存在年际分配不均的状况,常常造成各地的旱涝灾害,因此探明降水的时空变化规律,对农业生产以及居民生活都具有重要的意义。本文给出通过运用聚类分析、主成分分析和基于LSTM的神经网络三种方法综合建立的预测模型,并对江苏省内62个气象观测站点的降水量时间序列进行了预测,预测效率和精度综合表现较好。文章的重点在于如何将62个时间序列数据简化分析,在提高分析效率的同时保证预测精度,同时可以达到使用个人计算机便可高效的预测这62个站点降水量的目的。本文第一步利用聚类分析将62个站点的降水序列分成若干个局部特征相似的子类,第二步利用基于主成分分析的序列压缩法求出每个子类的主导序列,第三步利用基于LSTM的神经网络时间序列预测模型对每个子类的主导序列分别进行预测,并反算出每一子类中各气象站点降水量的预测值,最后通过计算标准化均方误差NMSE值对建立的预测模型的精度进行评估。基于江苏省62个气象观测站点1961年至2019年的年降水量数据,利用R语言和Python语言对降水量时间序列数据进行降水量预测,以期为合理分配水资源和防范气象灾害,减少经济损失提供一定的参考依据。文中第一步通过聚类分析将62个站点分为两类,该聚类结果与江苏省内各站点地理位置分布以及气候状况对应的十分合理;基于聚类结果,本文利用主成分分析提取出每一类的主导特征,每类有两个,共得到四个主导序列,每一类的总方差贡献率达到74%以上;最后利用基于LSTM的神经网络时间序列预测模型对这四个主导序列分别进行预测,并反算出这两类中每个气象站点降水量的预测值,最后通过计算每一类下的所有站点的NMSE的平均值进行模型预测精度的评估。实证研究结果表明:将江苏省降水量分为南北方两类进行预测比较合理,这与江苏省的地理及气候情况十分吻合;利用基于LSTM神经网络预测模型预测的降水量的精度较好,两类站点多次预测结果的平均NMSE分别在0.42和0.48左右,均明显小于1,同时预测程序的运行时间在个人计算机上不超过3分钟,效率极高。该研究为江苏省各气象观测站点未来的降水量提供了有效的预测方法,可对省内各市县的政府部门采取有效措施应对自然灾害、合理规划城市水资源等方面提供一定的参考依据。