论文部分内容阅读
摘 要:本文利用沈阳市2002年夏季的地面和高空气象观测资料,建立逐日降水量的三层BP神经网络预测模型。通过分析降水的形成原因,选择了高空和地面的气压场、温度场、湿度场和风场等18个气象要素作为模型的输入因子,以第二天的降水量作为模型的输出因子,并利用7月和9月的观测数据作为训练样本,确定了以tansig-logsig为传递函数,traingdx等三种函数为训练函数的网络最终结构。最后,利用2002年8月的观测数据对模型进行检验,结果显示:训练函数为trainlm函数时,网络的拟合效果和预测效果最好,对降水的预报准确率达到83.3%,降水综合TS评分为50%。实验表明了人工神经网络在短期降水预报方面具有良好的应用前景。
关键词:短期降水;BP神经网络;预测模型;训练函数
降水量是影响干旱最主要的因素,它直接决定着干旱的发生发展,在干旱预报中准确预报降水量是非常关键的。因此,深入研究降水预报新技术,提高预报准确率,对防灾减灾、推动社会经济的可持续发展具有重要意义。
目前预报降水的方法众多,主要包括传统的统计学方法和数值预报方法。这些方法均给出了具体的函数关系,意味着将降水变化规律化、公式化,反而限制了预测的准确性。
而人工神经网络的预测方法建立在对输入和输出变量的非线性映射之上,它只和训练样本和目标有关。该方法不仅克服了具体函数表达式的局限性,还能通过学习、训练过程选择相对最优网络对目标值进行预测。非线性,具反馈能力的神经网络模型在水文,泥沙等许多方面得到了广泛的应用,并取得了比较理想的结果。
郭光和严绍瑾等人[ 1 ]利用BP网络模型对我国东部6个城市的1991年(历史罕见涝年)和1994年(旱年)的汛期(5-9月)降水进行了模拟预报试验,模式预报的旱涝总体趋势与实况相符。误差分析表明:1991年和1994年预报值与实测值的相对误差和相关系数分别为0.134,0.150和0.931及0.904,效果较好。
金龙等人[ 2 ]进行了神经网络汛期降水预报性能与逐步回归预报准确率的对比分析,认为神经网络预报模型的预报性能明显优于逐步回归预报模型。
鉴于上述情况,本研究的主要目的是利用BP神经网络强大的非线性函数逼近功能,建立基于BP神经网络方法的短期降水量的预测模型,为降水量的预测提供一种新的尝试。
1 数据收集与处理
1.1 数据的收集
本次试验数据来源于辽宁省沈阳市气象观测站,位置为北纬41°44′、东经122°25′,海拔高度42.8米。沈阳市地处中国东北地区的南部,辽宁省的中部,位于北温带亚洲季风区北缘,属湿润半湿润暖温带大陆性气候,全年平均气温6.8℃-8.0℃,7月份气温最高,平均气温约24.0℃,1月份气温最低,月平均气温8.5℃,年降水量平均为721.9毫米。
本文收集沈阳气象站2002年的气象观测资料,包括地面观测图和高空500hPa观测图。选取7~9月的气压场、温度场、湿度场、风场和高度场等18个数据,用其中的7月和9月数据作为模型的训练集,8月的数据作为模型的检验集,来建立人工神经网络的降水预测模型。
1.2 数据的处理
从地面观测图和高空图中提取相关的数据,根据提取的数据的完整程度,进行修正。然后根据各个因子与日降水量的相关程度,选取相关系数较大的因子作为人工神经网络的输入因子。
由于原始数据幅值大小不一,有时候还相差比较悬殊。如果直接投入使用,测量值大的波动就会阻断神经网络的学习过程,使其不能反映小的测量值的变化。
所以,在网络训练之前,输人数据和目标矢量都要经过归一化处理。其中,归一化处理采用的公式如下:
式中:xn o r m为样本归一化的值;xi为样本初始值;xmax为样本最大值;xmin为样本最小值。
2 模型的建立及应用检验
2.1 BP神经网络建模
应用BP神经网络建模进行降水量的预测时,需先确定训练和检验样本集。为了能够更好地反映降水量的复杂程度,这里选择每年中降水量较大的7~9月的逐日气象资料作为样本,其中7月和9月的逐日气象资料作为训练样本,8月的数据作为检验样本。
在确定输入因子方面,主要选择与降水量相关的因子,气压场选择地面02时、14时气压和高空500hPa气压,温度场选择日平均气温和02时、04时的气温,此外,还选择了一些与降水密切相关的因素,如:日平均温度、低云量等。
确定输出因子为第二天的降水量。
2.2 网络参数的最终确定
确定优化的BP网络模型的具体参数如下:
2.3 三种训练函数预测评分
从预报准确率(对晴天和雨天预报正确的天数占总天数的百分比)、降水的准确率(成功预报降水的天数占实际降水天数的百分比)和综合降水的TS评分(对降水预报正确的天数占报对、报空和报漏总天数的百分比)方面,分别对这三种预测结果进行分析对比。如表3:
由上表可知,对于总的预报准确度来说,traingdx函数和trainlm函数的准确性相同,均为66.7%,trainscg函数的准确性较低,为56.7%。
對于降水预报的准确性来说,三种函数的差别很大,其中trainlm函数的预报效果最好,准确度达到83.3%,TS评分也最高,达到了50%,达到了预期的预报效果。
其次是trainscg函数,降水预报准确度为66.7%,降水的TS评分为38.1%,略高于traingdx函数的TS评分。
综上所述,当BP神经网络模型的训练函数为trainlm时,模型的预测效果做好,收敛速度也最快。对降水的预报准确率达到了83.3%,降水TS评分为50%,效果较好。 3 结论与讨论
3.1 主要结论
主要的结论可以概括如下:
1)本文在研究了降水的形成原因的基础上,确定了影响降水的相关因子,通过比较它们与输出因子之间的相关性,确定了18个因子作为网络的输入因子,主要有:高空的气压场、风场、湿度场和温度场,地面的气压场、变压场等,还有与降水相关的低云量。
2)通过利用样本对模型进行训练,确定了网络各个层次之间的传递函数:输入层到隐层为tansig函数,隐层到输出层位logsig函数。并且选择出了拟合效果比较好的训练函数,依次為traingdx函数、trainlm函数和trainscg函数。
3)由于隐层节点数对网络的性能影响比较大,本文通过比较三种不同训练函数对样本的拟合误差和训练速度,确定了每种训练函数的最佳隐层数:traingdx函数为12个、trainlm函数13个和trainscg函数9个。
4)分别利用三种训练函数进行降水预测,通过比较发现:当BP神经网络模型的训练函数为trainlm时,模型的预测效果最好,收敛速度也最快。对降水的预报准确率达到了83.3%,总降水的TS评分为50%。但对于中雨及以上量级的预测,效果不是很明显,还有待于进一步完善。
3.2 讨论
本文对降水的预报的准确率达到83.3%,但是对于中雨及中雨以上的降水预报效果不是很好。主要是逐日降水量是非正态、非线性、非平衡序列的问题,尤其是对于夏季短时降水,突变性非常强,无法抓住其规律。
所以,要增加降水预报的准确率,还需要做大量的工作。比如收集沈阳及沈阳周边地区4个以上的站点观测数据,增加降水预报的时空范围。收集更多有物理意义的输入因子,通过计算输入因子与降水量之间的相关系数,选择相关性较好的因子。若输入因子过多,可以尝试利用主成分分析,将因子做主成分分析,将浓缩的主成分作为新的输入因子。这样有可能提高预报精度。
参考文献:
[1] 郭光,严绍瑾,尹树新.人工神经网络用于我国东部汛期降水预测的研究[J].南京气象学院学报,1996,19(3):354-357.
[2] 金龙,陈宁,林振山.基于人工神经网络的集成预报方法研究和比较[J].气象学报,1999,57(2):198- 207.
关键词:短期降水;BP神经网络;预测模型;训练函数
降水量是影响干旱最主要的因素,它直接决定着干旱的发生发展,在干旱预报中准确预报降水量是非常关键的。因此,深入研究降水预报新技术,提高预报准确率,对防灾减灾、推动社会经济的可持续发展具有重要意义。
目前预报降水的方法众多,主要包括传统的统计学方法和数值预报方法。这些方法均给出了具体的函数关系,意味着将降水变化规律化、公式化,反而限制了预测的准确性。
而人工神经网络的预测方法建立在对输入和输出变量的非线性映射之上,它只和训练样本和目标有关。该方法不仅克服了具体函数表达式的局限性,还能通过学习、训练过程选择相对最优网络对目标值进行预测。非线性,具反馈能力的神经网络模型在水文,泥沙等许多方面得到了广泛的应用,并取得了比较理想的结果。
郭光和严绍瑾等人[ 1 ]利用BP网络模型对我国东部6个城市的1991年(历史罕见涝年)和1994年(旱年)的汛期(5-9月)降水进行了模拟预报试验,模式预报的旱涝总体趋势与实况相符。误差分析表明:1991年和1994年预报值与实测值的相对误差和相关系数分别为0.134,0.150和0.931及0.904,效果较好。
金龙等人[ 2 ]进行了神经网络汛期降水预报性能与逐步回归预报准确率的对比分析,认为神经网络预报模型的预报性能明显优于逐步回归预报模型。
鉴于上述情况,本研究的主要目的是利用BP神经网络强大的非线性函数逼近功能,建立基于BP神经网络方法的短期降水量的预测模型,为降水量的预测提供一种新的尝试。
1 数据收集与处理
1.1 数据的收集
本次试验数据来源于辽宁省沈阳市气象观测站,位置为北纬41°44′、东经122°25′,海拔高度42.8米。沈阳市地处中国东北地区的南部,辽宁省的中部,位于北温带亚洲季风区北缘,属湿润半湿润暖温带大陆性气候,全年平均气温6.8℃-8.0℃,7月份气温最高,平均气温约24.0℃,1月份气温最低,月平均气温8.5℃,年降水量平均为721.9毫米。
本文收集沈阳气象站2002年的气象观测资料,包括地面观测图和高空500hPa观测图。选取7~9月的气压场、温度场、湿度场、风场和高度场等18个数据,用其中的7月和9月数据作为模型的训练集,8月的数据作为模型的检验集,来建立人工神经网络的降水预测模型。
1.2 数据的处理
从地面观测图和高空图中提取相关的数据,根据提取的数据的完整程度,进行修正。然后根据各个因子与日降水量的相关程度,选取相关系数较大的因子作为人工神经网络的输入因子。
由于原始数据幅值大小不一,有时候还相差比较悬殊。如果直接投入使用,测量值大的波动就会阻断神经网络的学习过程,使其不能反映小的测量值的变化。
所以,在网络训练之前,输人数据和目标矢量都要经过归一化处理。其中,归一化处理采用的公式如下:
式中:xn o r m为样本归一化的值;xi为样本初始值;xmax为样本最大值;xmin为样本最小值。
2 模型的建立及应用检验
2.1 BP神经网络建模
应用BP神经网络建模进行降水量的预测时,需先确定训练和检验样本集。为了能够更好地反映降水量的复杂程度,这里选择每年中降水量较大的7~9月的逐日气象资料作为样本,其中7月和9月的逐日气象资料作为训练样本,8月的数据作为检验样本。
在确定输入因子方面,主要选择与降水量相关的因子,气压场选择地面02时、14时气压和高空500hPa气压,温度场选择日平均气温和02时、04时的气温,此外,还选择了一些与降水密切相关的因素,如:日平均温度、低云量等。
确定输出因子为第二天的降水量。
2.2 网络参数的最终确定
确定优化的BP网络模型的具体参数如下:
2.3 三种训练函数预测评分
从预报准确率(对晴天和雨天预报正确的天数占总天数的百分比)、降水的准确率(成功预报降水的天数占实际降水天数的百分比)和综合降水的TS评分(对降水预报正确的天数占报对、报空和报漏总天数的百分比)方面,分别对这三种预测结果进行分析对比。如表3:
由上表可知,对于总的预报准确度来说,traingdx函数和trainlm函数的准确性相同,均为66.7%,trainscg函数的准确性较低,为56.7%。
對于降水预报的准确性来说,三种函数的差别很大,其中trainlm函数的预报效果最好,准确度达到83.3%,TS评分也最高,达到了50%,达到了预期的预报效果。
其次是trainscg函数,降水预报准确度为66.7%,降水的TS评分为38.1%,略高于traingdx函数的TS评分。
综上所述,当BP神经网络模型的训练函数为trainlm时,模型的预测效果做好,收敛速度也最快。对降水的预报准确率达到了83.3%,降水TS评分为50%,效果较好。 3 结论与讨论
3.1 主要结论
主要的结论可以概括如下:
1)本文在研究了降水的形成原因的基础上,确定了影响降水的相关因子,通过比较它们与输出因子之间的相关性,确定了18个因子作为网络的输入因子,主要有:高空的气压场、风场、湿度场和温度场,地面的气压场、变压场等,还有与降水相关的低云量。
2)通过利用样本对模型进行训练,确定了网络各个层次之间的传递函数:输入层到隐层为tansig函数,隐层到输出层位logsig函数。并且选择出了拟合效果比较好的训练函数,依次為traingdx函数、trainlm函数和trainscg函数。
3)由于隐层节点数对网络的性能影响比较大,本文通过比较三种不同训练函数对样本的拟合误差和训练速度,确定了每种训练函数的最佳隐层数:traingdx函数为12个、trainlm函数13个和trainscg函数9个。
4)分别利用三种训练函数进行降水预测,通过比较发现:当BP神经网络模型的训练函数为trainlm时,模型的预测效果最好,收敛速度也最快。对降水的预报准确率达到了83.3%,总降水的TS评分为50%。但对于中雨及以上量级的预测,效果不是很明显,还有待于进一步完善。
3.2 讨论
本文对降水的预报的准确率达到83.3%,但是对于中雨及中雨以上的降水预报效果不是很好。主要是逐日降水量是非正态、非线性、非平衡序列的问题,尤其是对于夏季短时降水,突变性非常强,无法抓住其规律。
所以,要增加降水预报的准确率,还需要做大量的工作。比如收集沈阳及沈阳周边地区4个以上的站点观测数据,增加降水预报的时空范围。收集更多有物理意义的输入因子,通过计算输入因子与降水量之间的相关系数,选择相关性较好的因子。若输入因子过多,可以尝试利用主成分分析,将因子做主成分分析,将浓缩的主成分作为新的输入因子。这样有可能提高预报精度。
参考文献:
[1] 郭光,严绍瑾,尹树新.人工神经网络用于我国东部汛期降水预测的研究[J].南京气象学院学报,1996,19(3):354-357.
[2] 金龙,陈宁,林振山.基于人工神经网络的集成预报方法研究和比较[J].气象学报,1999,57(2):198- 207.