论文部分内容阅读
降水是一种动态的非线性的多时间尺度环流系统在气象上的表征,同时也是局部环流和热效应与地形和地貌相结合的产物。我国地处东亚季风区,是暴雨频发和多发地带,可能会造成山洪、泥石流等灾害的发生。因此,精确的降水估计和短时降水预测不仅是合理开发和科学配置水资源的基础,而且是确保社会稳定,人民生命财产安全,维护自然生态和环境的关键。目前,主流的降水预测方法主要包括数值天气预报和基于雷达回波外推的方法。数值天气预报(Numerical weather forecast,NWP)运用数学、物理学、大气动力学等方法分析天气演变过程,预报未来天气。NWP产品作为天气预报和气候预报的重要工具,为预报员的日常工作提供了重要的决策依据。但是数值预报本身存在不确定性及参数化误差的缺陷,这种不确定性主要与网格的精细化程度有关,参数化误差则主要是指初值误差和计算过程中的迭代误差。由于数值预报考虑了各项复杂因素,使得降水预报的工作成本大大增加。其次,NWP对于更长时间范围的预测比较准确,对临近降水预测效果不明显。雷达回波外推技术是根据当前时刻雷达观测结果,推测雷达回波未来的位置和强度,能够更快的实现对强对流系统的跟踪预报,目前被广泛应用于临近降雨预报中。基于雷达回波外推的主流方法是光流法,而光流法的局限性在于:(1)光流法仅仅考虑了相邻两帧图像之间的相对运动速度,而无法计算多帧图像之间的关系;(2)用光流法进行外推和预测的步骤是分开的容易造成误差的叠加,很难进一步提高降水估测的精度。本文从机器学习/深度学习的角度出发,在大数据的背景下,利用雷达回波数据和自动气象站数据,充分考虑到降水的时间和空间上的分布特点,将降水过程涉及的复杂的水文学、物理学等问题通过黑箱模型简化为样本输入、输出和误差三者之间的关系。本文完成了以下三个方面的工作:(1)提出一种基于小波变换和多时间尺度支持向量机的动态雷达定量降水估测模型。利用2017年华东地区的降水和雷达观测数据,以待估测时间为参考,选取前30分钟的雷达反射率和自动站降水数据,并将其变换到小波域中作为训练数据,然后利用支持向量机建立动态降水估测模型,进行间隔为6分钟的降水估测。这一方法采用前一段时间的数据动态地进行降水估测,大大提高了降水估测的TS(Threat Score)评分值,有效减小了均方根误差,实现了对华东地区的精细化降水估测。(2)提出一种基于高斯过程回归的短时雷达定量降水预测模型。根据深圳气象局提供的雷达回波序列和降水数据集,分别采用方向梯度直方图,尺度不变特征变换等方法对雷达回波序列图像特征提取,然后利用各种现有机器学习的方法如支持向量机、随机森林、高斯过程回归等方法构建训练模型,对比不同模型降水预测的结果,并根据预测降雨量和实际降水之间的误差计算均方根误差。其中表现最好的高斯过程回归模型的均方根误差(Root mean square error,RMSE)为9.174mm/h,比CIMK AnalytiCup 2017比赛中的第一名(RMSE为10.99 mm/h)的均方根误差约降低了16.5%。(3)提出一种用于短时临近降水预测的Tiny-RainNet网络模型。短时定量降水预测实际上是一个时空序列预测问题,以过去的雷达数据或者雷达图序列为输入,以未来一段时间的降雨量作为输出。一般的机器学习方法善于处理空间信息,对于时序信息则捉襟见肘。参考CRNN(Convolution Recurrent Neural Network)网络结构,结合卷积神经网络和双向长短时记忆网络的优势,提出了一种Tiny-RainNet模型用于短时降水预测。Tiny-RainNet模型首先通过卷积神经网络提取单张雷达回波图的上下文信息,再利用双向长短时记网络根据雷达回波序列的前后文关系进行分析预测。同时在每一个卷积层及双向长短时记忆网络层后增加池化层有效地防止因训练集过快拟合而导致的测试效果较差问题。实验结果表明,Tiny-RainNet(RMSE为9.40mm/h)的结果与比赛官方给出的线性回归的结果(RMSE为14.69mm/h)相比,RMSE减小了34.01%,与Conv-LSTM相比RMSE减小了16.88%。