论文部分内容阅读
摘 要:气温衍生品是一种用来规避天气风险的新型金融工具,它对能源、农业和旅游业等行业的稳健运行、绿色金融的发展、碳中和目标的实现都具有十分重要的价值。选取我国六个典型城市2009—2018年的日平均气温作为样本数据,利用ELM神经网络模型对气温时间序列进行预测与误差分析,借助蒙特卡洛模拟方法对气温衍生品定价。研究结果表明,ELM神经网络较ARMA模型和BP神经网络气温预测精度有显著提高,可为气温衍生品的定价奠定基础。
关键词:气温衍生品;ELM神经网络;蒙特卡洛方法;时间序列
一、引言
21世纪以来,应对全球气候变化成为人类实现全球可持续发展面临的最严峻的挑战。2020年10月20日,生态环境部、国家发改委、中国人民银行、中国银保监会、中国证监会等五部门共同发布了《关于促进应对气候变化投融资的指导意见》,提出加快构建气候投融资政策体系,强调开展气候投融资地方试点,鼓励地方开展模式和工具创新。气候金融在我国还处于起步阶段,气候金融的发展可以帮助私营部门、企业和个人进行气候风险管理,促进经济平稳运行。气候金融体系建设不能忽视天气风险。据《中国统计年鉴》数据显示,2019年因天气风险导致的直接经济损失逾3270亿元。可以预见,丰富和创新天气风险的金融管理手段将成为我国绿色金融和气候金融市场新的发展内容。
1996年8月,美国安然公司与佛罗里达西南电力公司签订了世界上第一笔气候衍生品合同,这标志着与气候风险相关的金融工具开始兴起。而天气衍生品的发展则始于1999年美国芝加哥商品交易所上市了第一个以气温为标的的指数天气衍生品。近年来,我国天气灾害事件频发,对各行各业造成不同程度的影响。但作为对冲天气风险最有效的金融工具——天气衍生品在我国还处于探索阶段。2014年国务院出台的《关于加快发展现代保险服务业的若干意见》指出要探索天气指数等新兴产品和服务,这为我国天气衍生品的创新和发展奠定了政策基础。虽然大连商品交易所推出了北京、上海、广州、武汉和哈尔滨这五个城市月平均温度、月制冷指数(Cooling Degree Days,CDD)及月取暖指数(Heating Degree Days,HDD),但是在市面上还没有出现可交易的天气衍生品。因此,针对我国各个城市研发相应的天气衍生品具有很强的现实意义。
目前,天气衍生品合约所涉及的天气标的指数主要有基于累积气温的HDD指数和CDD指数、风力指数、降雪量指数、降雨量指数、湿度指数等,其中基于累积气温HDD指数和CDD指数的合约交易量占了全市场交易的60%以上,因此,建立一个合适的气温指数模型对于气温衍生品的合理定价和推动天气衍生品市场的快速发展至关重要。关于气温指数模型的研究方法大体可分为四类:
第一类是随机过程模型,主要考虑日平均气温变化具有均值回复及跳跃特征,采用均值回复(Ornstein-Uhlenbeck,O-U)模型或马尔科夫状态转移(Markov Regime-switching,MRS)模型对气温变化进行动态模拟。这类模型以Benth等(2007)[1]提出的日平均温度波动率O-U模型为基础,Elias等(2014)[2]引入了由布朗运动驱动的两状态MRS模型。为拟合气温数据的跳跃性,Gyamerah等(2018)[3]提出Levy过程驱动的MRS模型,杨刚和杨徐进(2020)[4]提出布朗运动驱动的带常数指数的MRS模型,进一步提高了气温拟合的精确性。
第二类是时间序列模型,针对日平均气温具有长期趋势、季节性、自相关性、波动聚集性和非对称性等特征,对气温变化路径进行模拟和预测。这类模型以Caballero等(2002)[5]引入的自回归滑动平均(Autoregressive Moving-average,ARMA)模型和自回归分数整合滑动平均(Autoregressive Fractionally Integrated Moving Average,ARFIMA)模型为代表。针对气温数据的记忆性特征,通常引入ARMA模型模拟短期的记忆性特征,引入ARFIMA、FIGARCH等模型模拟长期记忆性特征。针对气温数据的非对称效应,Zhou等(2019)[6]引入EGARCH模型,侯县平(2019)[7]引入APARCH模型。相比于第一类随机过程模型,时间序列模型对气温指数预测相对容易操作。
第三类是统计模型,主要是解决极值气温的拟合,这类研究一般通过统计分布对气温极值的随机变化进行拟合。Ah?an(2012)[8]采用方差伽马(Variance gamma,VC)分布和正态逆高斯(Normal inverse Gaussian,NIG)分布,Erhardt和Smith(2014)[9]、崔海蓉等(2017)[10]均采用广义极值(Generalized Extreme Value,GEV)分布拟合极端气温变化,分析极端气温的跳跃性。
第四类是算法模型,主要将各类算法与气温衍生品定价结合起来,采用机器学习方法拟合日平均气温变化。国外学者在这类模型方面的研究成果较为丰硕。Fujita和Mori(2012)[11]引入了确定性退火(Deterministic annealing,DA)聚类方法,Mori和Okada(2016)[12]在DA聚类方法基础上进一步拓展,即对DA聚类的气温数据采用人工神经网络的多层感知器(Multi-Layer Perceptron of Artificial Neural Network,MLPOANN)进行分析,进一步改善气温模型的拟合效果。Alexandridis等(2017)[13]提出了三层网络结构的小波网络(Wavelet Networks,WN)算法和GP算法,并将这两种算法与Alaton模型、Benth模型、前馈神经网络(Neural Networks,NN)算法、徑向基函数(Radial Basis Function,RBF)神经网络以及支持向量机回归(Support Vector Regression,SVR)模型进行对比分析。国内对这类模型的研究较少,涂春丽和王芳(2012)[14]引入具有快速收敛特性的BP(Back Propagation)神经网络算法拟合重庆市月平均气温数据。 各种新的统计方法和计量工具被不断应用于气温衍生品定价研究,推动了气温指数模型的发展。但梳理文献发现现有研究存在三点不足,有待进一步完善。第一,国内外对于神经网络的研究多基于基础的BP神经网络或RBF神经网络,但是神经网络种类繁多且不断发展,还没有文献将一些新的神经网络算法引入气温指数预测模型中。第二,目前大多数研究只拟合我国单个城市的数据,但是我国各城市气候差异大,单个城市的实证分析不足以证明模型的适用性。目前还没有研究利用神经网络等机器学习算法拟合我国各城市气温数据。第三,国内文献对于机器学习算法模型在气温指数预测方面的研究相对缺乏,且只是将最简单的三层神经网络引入气温指数预测中,缺乏对于预测效果的对比,难以分析神经网络算法与其他类模型对气温指数预测的优缺点。
受Huang等(2005)[15]启发,本文选择六个样本城市,引入极限学习机(Extreme Learning Machine,ELM)神经网络进行气温预测,并与ARMA模型和BP神经网络进行对比分析。传统的神经网络,尤其是单隐含层前馈神经网络(如BP神经网络),常因学习步长设置问题,致使算法收敛速度较慢,从而产生局部最小值以及精度较低的问题。而ELM神经网络的优势在于,学习速度更快,泛化性能更好,且模型自身具有较强的鲁棒性。我国幅员辽阔,气候差异大,本文将按照区域划分,选取北京、沈阳、上海、广州、重庆和延安分别作为我国华北地区、华东地区、中南地区、西南地区和西北地区样本城市进行气温衍生品定价研究。
二、气温预测模型的构建
气温衍生品市场的迅速发展取决于产品的合理定价,而衍生品合理定价的前提是对标的气温的合理预测,因此,构建一个合理的气温预测模型,对减少气温预测的误差相当重要。
(一)理论基础
时间序列拟合与预测问题是机器学习领域一个新的研究方向,在很多复杂问题中,对于一些目标变量的预测以及后续的应用和实践至关重要。气温时间序列就是一个典型的例子。气温数据具有季节性变化趋势、短期和长期记忆性以及跳跃性,而机器学习算法可以较好地拟合这些特征,并做出更精准的预测。
现有的几类模型,各有优缺点。随机过程模型为气温预测的跳跃性提供了一种简便的算法,但是很明显的缺点是严重依赖过去信息对未来的反应。由于每个城市都具有独特的统计特征,这类模型需要针对每个城市进行调整,有了新的数据时,需要重新校准新的模型。而时间序列模型虽然解决了随机过程模型需要不断更新模型的问题,操作也更为简便,但是对于气温的极值数据预测精度不够。上述问题促使人们使用机器学习方法来实现对气温数据更准确的预测,从而捕捉气温的动态变化。机器学习算法的最大优点是探索了数据的结构和特征。使用机器学习算法可以建立一个更稳健的模型,能够代表一系列不同的气候类型,并提供更精准的预测结果。与此同时,机器学习可以处理随机发生的峰值,在气温极值数据预测方面展现出极大的优势。本文通过对比ARMA模型、BP神经网络和ELM神经网络来验证机器学习算法是否能够显著提高预测精度,同时验证BP神经网络和ELM神经网络对于气温极值数据的拟合效果。
1. ARMA模型。ARMA模型是时间序列数据处理的一种经典模型,受Caballero等(2002)[5]启发,我们利用该模型进行气温预测。对于时间序列[xt],[ARMA(p,q)]模型的具体形式如式(1)所示:
2. BP神经网络。BP神经网络是通过模拟大脑神经传导系统特征构建的机器学习模型,它是一种单向传导的前馈神经网络,通常由输入层、隐含层和输出层构成,每一层包含大量神经元,不同层神经元的权重不同且相互连接形成网络结构,但是权重和神经元之间的映射关系不需要提前定义和描述。BP神经网络的原理是利用梯度下降法,通过误差反向传播来不断调整模型的权重和阈值,使网络的误差平方和最小。该模型被广泛应用于非线性建模和函数逼近等问题中,一个三层的BP神经网络就可以实现任意N维到M维的映射,涂春丽和王芳(2012)[14]将它应用于气温预测研究领域。
3. ELM神经网络。徐睿等(2019)[16]证明,ELM模型在保证学习精度的前提下,相较传统的学习算法,具有速度更快、泛化能力更强、实现更加简单以及人为干预更少等特点,因此,我们拟将ELM神经网络引入气温指数预测研究中。
本文主要利用BP神经网络和ELM神经网络的时间序列分析及预测功能,对比两种方法的预测效果。两种神经网络都是三层前向反馈网络,第一层为输入层,第二层为隐含层,第三层为输出层。在使用神经网络进行时间序列建模时,需要对数据进行如下处理:一是对时间序列数据建立自回归模型;二是根据模型结果确定滞后阶数对数据的影响;三是根据不同滞后阶数对数据影响程度确定输入层的数目。
(二)模型构建
ARMA模型在处理时间序列数据的季节性波动和自相关性特点方面具有良好的表现,而ELM神经网络在进行气温预测时精度较高。本文尝试将两者结合应用于天气衍生品定价中,与此同时,本文将引入ELM神经网络并与传统的BP神经网络进行对比,对丰富气温指数预测及定价体系将产生积极影响。
本文选取2009年1月1日—2018年12月31日六个样本城市的日平均气温数据作为训练集进行建模,使用2019年1月1日—2019年12月31日六个试点城市的日平均气温数据作为测试集对模型进行评估。之后,先使用ARMA模型拟合时间序列数据,确定输入层个数,再使用机器学习算法中的BP神经网络和ELM神经网络进行实证对比分析,構建气温预测模型,同时对比ELM神经网络与ARMA模型和BP神经网络的预测结果。最后使用蒙特卡洛方法进行气温衍生品定价。
三、实证分析
我国土地辽阔,由于降水量和气温的差异性,使得我国气候呈现出多样性。目前不存在一种气温指数可以完美地应用于全国所有城市,因此,需要对气候不同的区域进行细分,再制定相应区域的气温指数。 (一)数据来源与统计分析
本文数据来源于美国国家海洋和大气局(National Oceanic Atmospheric Adminstration,NOAA)中的global summary of the day数据库,选取六个代表城市2009—2019年的日平均气温作为研究对象,剔除闰年2月29日的记录。六个城市气温的描述性统计见表1。由于不同的气候特点和地理位置,这六个城市的气温呈现出较大的差异。北京大部分时间气温维持在1.8~23.7℃之间,在这六个城市中属于中间水平。相比之下,沈阳的气温更低,最低气温可以达到零下23.9℃,大部分时间气温维持在-3.2~21.0℃之间,在六个城市中属于气候寒冷型。上海和广州呈现出相似的气候特征,两个城市的描述性统计指标较为接近。重庆大部分时间气温维持在11.4~24.8℃之间,在六个城市中属于气候炎热型。延安的气候与北京相似,但是比北京更寒冷。六个城市温度变化情况见图3。各城市2009—2018年的日平均气温数据存在差异,且呈现出明显季节性波动,时间序列为非平稳时间序列。
(二)气温预测模型
1. ARMA模型。对原序列构建ARMA模型,为了消除原序列中的趋势及季节性波动,对原序列进行一阶差分,一阶差分后的序列不再呈现出明显的趋势性,其数值围绕着0上下波动,呈现出比较平稳的状态。本文对时间序列进行ADF检验,具体结果如表2所示。各城市未经处理的时间序列[p]值都大于0.05,证明原始序列是非平稳时间序列。一阶差分后的时间序列[p]值都远小于0.01,有理由拒绝原假设,说明经过一阶差分处理后的序列是平稳的,可以使用差分后序列构建[ARMA(p,q)]模型。
為了选择适当的[ARMA(p,q)]模型拟合处理后的时间序列,根据样本自相关图的性质估计[p]和[q]。各城市时间序列的自相关图见图4。根据自相关系数的截尾情况以及自动定阶的结果可以判断各个城市的日平均气温时间序列适合建立[AR(p)]模型,即气温数据具有明显的自相关性。具体来说,北京可以建立[AR(3)]模型,其他5个城市可以建立[AR(5)]模型。确定模型阶数后,可以对模型中的参数进行估计,具体结果如表3所示。
2. 神经网络。在ARMA模型的基础上,本文分别构建BP神经网络模型和ELM神经网络模型。确定自回归模型的具体阶数后,就可以确定神经网络的输入层。本文以北京第[t-1]天、[t-2]天和[t-3]天气温数据作为输入层,其他城市以第[t-1]天、[t-2]天、[t-3]天、[t-4]天和[t-5]天气温数据作为输入层,以第[t]天气温数据作为输出层,构建神经网络模型。本文尝试设置不同的隐含层个数调试模型,最终确定最佳的隐含层个数。
3. 模型预测及误差分析。通过上述构建的模型,可以将验证集数据代入,以检验模型预测能力。首先,检验ARMA模型的预测能力。ARMA模型预测的各城市2019年日平均气温预测值与实际值对比情况如图5所示,图中虚线代表ARMA模型预测结果,实线代表实际值。由图5可知,ARMA模型对北京、沈阳、上海和延安的日平均气温预测效果较好,但是对广州和重庆日平均气温的预测要低于实际值。由此可见,ARMA模型虽然能大致预测温度走势,但是预测精度有待提升。
其次,检验BP神经网络模型预测能力。BP神经网络模型预测的各城市2019年日平均气温预测值与实际值对比情况如图6所示,图中虚线代表BP神经网络模型预测结果,实线代表实际值。由图可知,BP神经网络对于各城市日平均气温预测结果较为准确,可以清晰地拟合温度变化曲线,但在温度发生频繁波动时,其预测精度会受到影响,导致预测不够精确。这种现象集中出现在高温时段。
最后,检验BLM神经网络模型预测能力。其预测值与实际值对比情况如图7所示,图中虚线代表ELM神经网络模型预测结果,实线代表实际值。由图7可知,ELM神经网络解决了BP神经网络在高温时段预测不准确的问题,且整体预测精度高于BP神经网络。
综上所述,三种模型对于每个城市平均气温数据的预测精度是不同的,为了对比三种模型的预测精度,并验证ELM神经网络是否在气温预测方面性能更优越,本文使用平均绝对误差(MAE)和均方根误差(RMSE)两种测度方法来评价预测精度,具体计算公式如下:
其中,[N]是训练集的长度,[Xi]代表预测的日平均气温,[Yi]代表[t]数据点的实际温度。各城市神经网络预测精度如表4所示。由表可知,三种模型预测精度都比较高,标准误差较小。三种模型对于各个城市日均气温的拟合效果有所不同:对于ARMA模型,上海的预测效果最好,武汉的预测效果最差;而BP神经网络模型对上海的预测效果最好,沈阳的预测效果最差;ELM神经网络模型对重庆的预测效果最好,对沈阳的预测效果最差。总的来说,ELM神经网络的预测结果比ARMA模型和BP神经网络更准确。
四、气温衍生品定价及应用分析
通过合理的气温指数模型对气温进行预测后,就可以根据预测结果进行气温衍生品定价。简单来说,气温指数就是将合约城市的日平均气温进行相关处理得到的指数。下面简单介绍两种常见的气温指数:Heating Degree Day指数简称HDD指数,又称日取暖指数;Cooling Degree Day指数简称CDD指数,又称日制冷指数。
基于HDD指数和CDD指数的天气衍生品广泛运用于农业、能源、旅游、公共事业等行业。例如,极寒天气发生时,如果没有采取任何措施来对冲风险,那么公共事业单位需要承担由极寒天气造成的所有支出。但是如果事业单位提前购买HDD指数天气衍生品,那么就可以有效对冲天气风险。
对于给定的站点,基准温度通常为65华氏度或18摄氏度。HDD是日平均温度低于基准温度的度数,而CDD是日平均气温高于基准温度的度数。简而言之,HDD和CDD的计算如下: 按照上述定义利用蒙特卡洛方法对六个代表城市的HDD看涨期权合约进行定价,具体定价结果如表7所示。
上述六个试点城市的合约可以用来对冲1月份气温低于正常温度的风险,其他气候特征相似的城市若有天气风险管理需求也可以同样定价。表7中,各地区气候类型不同,气温期权价格也不同,可以使用我国标准气候区划方案减少定价时的差异。随着模拟次数增加,各城市期权价格变化趋势如图8所示。经过蒙特卡洛模拟,HDD期权的价格是缓慢收敛的,验证了模型的有效性。CDD指数期权的定价原理与HDD指数相同。
五、结论
本文基于气温的时间序列数据,构建了能够准确刻画气温趋势的ARMA模型、BP神经网络模型和ELM神经网络模型。由于我国土地辽阔,气候多变,所以用上述模型对北京、沈阳、上海、广州、重庆和延安这六个代表城市进行实证分析。模型的拟合和预测效果都比较理想,但相比之下,ELM神经网络的预测效果更好,它可为气温衍生品的定价提供决策参考。
气温衍生品作为管理气候风险的金融创新工具,能有效分散各行业的天气风险,但是我国对于这种金融创新路径的探索和应用都尚未展开。我国的农业、能源业、电力等行业极易受气候影响,对天气衍生品需求巨大。因此,需要大力发展气温指数衍生品合约以满足我国各行业天气风险管理和气候风险管理的需求。
目前我国的天气衍生品市场处于初级阶段,只有大连商品交易所率先针对几个主要城市推出了温度指数。但这几个地区的温度指数无法概括全国的气温特征,也无法满足全国各行各业对天气衍生品的需求。随着我国天气风险对各行各业影响的不断加强,对天气衍生品的需求也不断增大,我们需要根据各个地区不同的气候特征,开发不同的天气衍生品来规避天气风险,以实现国民经济持续稳定发展。
参考文献:
[1]Benth F E,Benth J. 2007. The Volatility of Temperature and Pricing of Weather Derivatives [J].Quantitative Finance,7(5).
[2]Elias R S,Wahab M I M,Fang L. 2014. A Comparison of Regime-Switching Temperature Modeling Approaches for Applications in Weather Derivatives [J].European Journal of Operational Research,232(3).
[3]Gyamerah S A,Ngare P,Ikpe D. 2018. Regime-switching Temperature Dynamics Model for Weather Derivatives [J].International Journal of Stochastic Analysis,1-15.
[4]楊刚,杨徐进. 基于马尔科夫状态转移模型的天气衍生品定价 [J].经济数学,2020,37(2).
[5]Caballero R,Jewson S,Brix A. 2002. Long Memory in Surface Air Temperature:Detection,Modeling,and Application to Weather Derivative Valuation [J].Climate Research, 21(2).
[6]Zhou R,Li J S H,Pai J. 2019. Pricing Temperature Derivatives with a Filtered Historical Simulation Approach[J].The European Journal of Finance,25(15).
[7]侯县平.基于典型事实特征的天气衍生品中气温预测模型研究 [J].统计与管理,2019,(1).
[8]Ah?an A. 2012. Statistical Analysis of Model Risk Concerning Temperature Residuals and its Impact on Pricing Weather Derivatives [J].Insurance:Mathematics and Economics,50(1).
[9]Erhardt R J,Smith R L. 2014. Weather Derivative Risk Measures for Extreme Events [J].North American Actuarial Journal,18(3).
[10]崔海蓉,曹广喜,张京波.高温天气衍生品设计及其定价模型——以长江中下游地区水稻为例 [J].系统工程,2017,35(4).
[11]Fujita H,Mori H. 2012. A Hybrid Intelligent System for Designing a Contract Model for Weather Derivatives[J].Procedia Computer Science,12.
[12]Mori H,Okada M. 2016. An ANN-based Design for Weather Derivatives in Consideration of Meteorological Uncertainties [C].2016 IEEE Innovative Smart Grid Technologies-Asia (ISGT-Asia).IEEE.
[13]Alexandridis A K,Kampouridis M,Cramer S. 2017. A Comparison of Wavelet Networks and Genetic Programming in the Context of Temperature Derivatives [J].International Journal of Forecasting,33(1).
[14]涂春丽,王芳.基于神经网络和蒙特卡罗方法的天气衍生品定价研究 [J].中原工学院学报,2012,23(3).
[15]Guang-Bin Huang,Qin-Yu Zhu,Chee-Kheong Siew. 2005. Extreme Learning Machine:Theory and Applications [J].Neurocomputing,70(1).
[16]徐睿,梁循,齐金山,李志宇,张树森.极限学习机前沿进展与趋势 [J].计算机学报,2019,42(7).
关键词:气温衍生品;ELM神经网络;蒙特卡洛方法;时间序列
一、引言
21世纪以来,应对全球气候变化成为人类实现全球可持续发展面临的最严峻的挑战。2020年10月20日,生态环境部、国家发改委、中国人民银行、中国银保监会、中国证监会等五部门共同发布了《关于促进应对气候变化投融资的指导意见》,提出加快构建气候投融资政策体系,强调开展气候投融资地方试点,鼓励地方开展模式和工具创新。气候金融在我国还处于起步阶段,气候金融的发展可以帮助私营部门、企业和个人进行气候风险管理,促进经济平稳运行。气候金融体系建设不能忽视天气风险。据《中国统计年鉴》数据显示,2019年因天气风险导致的直接经济损失逾3270亿元。可以预见,丰富和创新天气风险的金融管理手段将成为我国绿色金融和气候金融市场新的发展内容。
1996年8月,美国安然公司与佛罗里达西南电力公司签订了世界上第一笔气候衍生品合同,这标志着与气候风险相关的金融工具开始兴起。而天气衍生品的发展则始于1999年美国芝加哥商品交易所上市了第一个以气温为标的的指数天气衍生品。近年来,我国天气灾害事件频发,对各行各业造成不同程度的影响。但作为对冲天气风险最有效的金融工具——天气衍生品在我国还处于探索阶段。2014年国务院出台的《关于加快发展现代保险服务业的若干意见》指出要探索天气指数等新兴产品和服务,这为我国天气衍生品的创新和发展奠定了政策基础。虽然大连商品交易所推出了北京、上海、广州、武汉和哈尔滨这五个城市月平均温度、月制冷指数(Cooling Degree Days,CDD)及月取暖指数(Heating Degree Days,HDD),但是在市面上还没有出现可交易的天气衍生品。因此,针对我国各个城市研发相应的天气衍生品具有很强的现实意义。
目前,天气衍生品合约所涉及的天气标的指数主要有基于累积气温的HDD指数和CDD指数、风力指数、降雪量指数、降雨量指数、湿度指数等,其中基于累积气温HDD指数和CDD指数的合约交易量占了全市场交易的60%以上,因此,建立一个合适的气温指数模型对于气温衍生品的合理定价和推动天气衍生品市场的快速发展至关重要。关于气温指数模型的研究方法大体可分为四类:
第一类是随机过程模型,主要考虑日平均气温变化具有均值回复及跳跃特征,采用均值回复(Ornstein-Uhlenbeck,O-U)模型或马尔科夫状态转移(Markov Regime-switching,MRS)模型对气温变化进行动态模拟。这类模型以Benth等(2007)[1]提出的日平均温度波动率O-U模型为基础,Elias等(2014)[2]引入了由布朗运动驱动的两状态MRS模型。为拟合气温数据的跳跃性,Gyamerah等(2018)[3]提出Levy过程驱动的MRS模型,杨刚和杨徐进(2020)[4]提出布朗运动驱动的带常数指数的MRS模型,进一步提高了气温拟合的精确性。
第二类是时间序列模型,针对日平均气温具有长期趋势、季节性、自相关性、波动聚集性和非对称性等特征,对气温变化路径进行模拟和预测。这类模型以Caballero等(2002)[5]引入的自回归滑动平均(Autoregressive Moving-average,ARMA)模型和自回归分数整合滑动平均(Autoregressive Fractionally Integrated Moving Average,ARFIMA)模型为代表。针对气温数据的记忆性特征,通常引入ARMA模型模拟短期的记忆性特征,引入ARFIMA、FIGARCH等模型模拟长期记忆性特征。针对气温数据的非对称效应,Zhou等(2019)[6]引入EGARCH模型,侯县平(2019)[7]引入APARCH模型。相比于第一类随机过程模型,时间序列模型对气温指数预测相对容易操作。
第三类是统计模型,主要是解决极值气温的拟合,这类研究一般通过统计分布对气温极值的随机变化进行拟合。Ah?an(2012)[8]采用方差伽马(Variance gamma,VC)分布和正态逆高斯(Normal inverse Gaussian,NIG)分布,Erhardt和Smith(2014)[9]、崔海蓉等(2017)[10]均采用广义极值(Generalized Extreme Value,GEV)分布拟合极端气温变化,分析极端气温的跳跃性。
第四类是算法模型,主要将各类算法与气温衍生品定价结合起来,采用机器学习方法拟合日平均气温变化。国外学者在这类模型方面的研究成果较为丰硕。Fujita和Mori(2012)[11]引入了确定性退火(Deterministic annealing,DA)聚类方法,Mori和Okada(2016)[12]在DA聚类方法基础上进一步拓展,即对DA聚类的气温数据采用人工神经网络的多层感知器(Multi-Layer Perceptron of Artificial Neural Network,MLPOANN)进行分析,进一步改善气温模型的拟合效果。Alexandridis等(2017)[13]提出了三层网络结构的小波网络(Wavelet Networks,WN)算法和GP算法,并将这两种算法与Alaton模型、Benth模型、前馈神经网络(Neural Networks,NN)算法、徑向基函数(Radial Basis Function,RBF)神经网络以及支持向量机回归(Support Vector Regression,SVR)模型进行对比分析。国内对这类模型的研究较少,涂春丽和王芳(2012)[14]引入具有快速收敛特性的BP(Back Propagation)神经网络算法拟合重庆市月平均气温数据。 各种新的统计方法和计量工具被不断应用于气温衍生品定价研究,推动了气温指数模型的发展。但梳理文献发现现有研究存在三点不足,有待进一步完善。第一,国内外对于神经网络的研究多基于基础的BP神经网络或RBF神经网络,但是神经网络种类繁多且不断发展,还没有文献将一些新的神经网络算法引入气温指数预测模型中。第二,目前大多数研究只拟合我国单个城市的数据,但是我国各城市气候差异大,单个城市的实证分析不足以证明模型的适用性。目前还没有研究利用神经网络等机器学习算法拟合我国各城市气温数据。第三,国内文献对于机器学习算法模型在气温指数预测方面的研究相对缺乏,且只是将最简单的三层神经网络引入气温指数预测中,缺乏对于预测效果的对比,难以分析神经网络算法与其他类模型对气温指数预测的优缺点。
受Huang等(2005)[15]启发,本文选择六个样本城市,引入极限学习机(Extreme Learning Machine,ELM)神经网络进行气温预测,并与ARMA模型和BP神经网络进行对比分析。传统的神经网络,尤其是单隐含层前馈神经网络(如BP神经网络),常因学习步长设置问题,致使算法收敛速度较慢,从而产生局部最小值以及精度较低的问题。而ELM神经网络的优势在于,学习速度更快,泛化性能更好,且模型自身具有较强的鲁棒性。我国幅员辽阔,气候差异大,本文将按照区域划分,选取北京、沈阳、上海、广州、重庆和延安分别作为我国华北地区、华东地区、中南地区、西南地区和西北地区样本城市进行气温衍生品定价研究。
二、气温预测模型的构建
气温衍生品市场的迅速发展取决于产品的合理定价,而衍生品合理定价的前提是对标的气温的合理预测,因此,构建一个合理的气温预测模型,对减少气温预测的误差相当重要。
(一)理论基础
时间序列拟合与预测问题是机器学习领域一个新的研究方向,在很多复杂问题中,对于一些目标变量的预测以及后续的应用和实践至关重要。气温时间序列就是一个典型的例子。气温数据具有季节性变化趋势、短期和长期记忆性以及跳跃性,而机器学习算法可以较好地拟合这些特征,并做出更精准的预测。
现有的几类模型,各有优缺点。随机过程模型为气温预测的跳跃性提供了一种简便的算法,但是很明显的缺点是严重依赖过去信息对未来的反应。由于每个城市都具有独特的统计特征,这类模型需要针对每个城市进行调整,有了新的数据时,需要重新校准新的模型。而时间序列模型虽然解决了随机过程模型需要不断更新模型的问题,操作也更为简便,但是对于气温的极值数据预测精度不够。上述问题促使人们使用机器学习方法来实现对气温数据更准确的预测,从而捕捉气温的动态变化。机器学习算法的最大优点是探索了数据的结构和特征。使用机器学习算法可以建立一个更稳健的模型,能够代表一系列不同的气候类型,并提供更精准的预测结果。与此同时,机器学习可以处理随机发生的峰值,在气温极值数据预测方面展现出极大的优势。本文通过对比ARMA模型、BP神经网络和ELM神经网络来验证机器学习算法是否能够显著提高预测精度,同时验证BP神经网络和ELM神经网络对于气温极值数据的拟合效果。
1. ARMA模型。ARMA模型是时间序列数据处理的一种经典模型,受Caballero等(2002)[5]启发,我们利用该模型进行气温预测。对于时间序列[xt],[ARMA(p,q)]模型的具体形式如式(1)所示:
2. BP神经网络。BP神经网络是通过模拟大脑神经传导系统特征构建的机器学习模型,它是一种单向传导的前馈神经网络,通常由输入层、隐含层和输出层构成,每一层包含大量神经元,不同层神经元的权重不同且相互连接形成网络结构,但是权重和神经元之间的映射关系不需要提前定义和描述。BP神经网络的原理是利用梯度下降法,通过误差反向传播来不断调整模型的权重和阈值,使网络的误差平方和最小。该模型被广泛应用于非线性建模和函数逼近等问题中,一个三层的BP神经网络就可以实现任意N维到M维的映射,涂春丽和王芳(2012)[14]将它应用于气温预测研究领域。
3. ELM神经网络。徐睿等(2019)[16]证明,ELM模型在保证学习精度的前提下,相较传统的学习算法,具有速度更快、泛化能力更强、实现更加简单以及人为干预更少等特点,因此,我们拟将ELM神经网络引入气温指数预测研究中。
本文主要利用BP神经网络和ELM神经网络的时间序列分析及预测功能,对比两种方法的预测效果。两种神经网络都是三层前向反馈网络,第一层为输入层,第二层为隐含层,第三层为输出层。在使用神经网络进行时间序列建模时,需要对数据进行如下处理:一是对时间序列数据建立自回归模型;二是根据模型结果确定滞后阶数对数据的影响;三是根据不同滞后阶数对数据影响程度确定输入层的数目。
(二)模型构建
ARMA模型在处理时间序列数据的季节性波动和自相关性特点方面具有良好的表现,而ELM神经网络在进行气温预测时精度较高。本文尝试将两者结合应用于天气衍生品定价中,与此同时,本文将引入ELM神经网络并与传统的BP神经网络进行对比,对丰富气温指数预测及定价体系将产生积极影响。
本文选取2009年1月1日—2018年12月31日六个样本城市的日平均气温数据作为训练集进行建模,使用2019年1月1日—2019年12月31日六个试点城市的日平均气温数据作为测试集对模型进行评估。之后,先使用ARMA模型拟合时间序列数据,确定输入层个数,再使用机器学习算法中的BP神经网络和ELM神经网络进行实证对比分析,構建气温预测模型,同时对比ELM神经网络与ARMA模型和BP神经网络的预测结果。最后使用蒙特卡洛方法进行气温衍生品定价。
三、实证分析
我国土地辽阔,由于降水量和气温的差异性,使得我国气候呈现出多样性。目前不存在一种气温指数可以完美地应用于全国所有城市,因此,需要对气候不同的区域进行细分,再制定相应区域的气温指数。 (一)数据来源与统计分析
本文数据来源于美国国家海洋和大气局(National Oceanic Atmospheric Adminstration,NOAA)中的global summary of the day数据库,选取六个代表城市2009—2019年的日平均气温作为研究对象,剔除闰年2月29日的记录。六个城市气温的描述性统计见表1。由于不同的气候特点和地理位置,这六个城市的气温呈现出较大的差异。北京大部分时间气温维持在1.8~23.7℃之间,在这六个城市中属于中间水平。相比之下,沈阳的气温更低,最低气温可以达到零下23.9℃,大部分时间气温维持在-3.2~21.0℃之间,在六个城市中属于气候寒冷型。上海和广州呈现出相似的气候特征,两个城市的描述性统计指标较为接近。重庆大部分时间气温维持在11.4~24.8℃之间,在六个城市中属于气候炎热型。延安的气候与北京相似,但是比北京更寒冷。六个城市温度变化情况见图3。各城市2009—2018年的日平均气温数据存在差异,且呈现出明显季节性波动,时间序列为非平稳时间序列。
(二)气温预测模型
1. ARMA模型。对原序列构建ARMA模型,为了消除原序列中的趋势及季节性波动,对原序列进行一阶差分,一阶差分后的序列不再呈现出明显的趋势性,其数值围绕着0上下波动,呈现出比较平稳的状态。本文对时间序列进行ADF检验,具体结果如表2所示。各城市未经处理的时间序列[p]值都大于0.05,证明原始序列是非平稳时间序列。一阶差分后的时间序列[p]值都远小于0.01,有理由拒绝原假设,说明经过一阶差分处理后的序列是平稳的,可以使用差分后序列构建[ARMA(p,q)]模型。
為了选择适当的[ARMA(p,q)]模型拟合处理后的时间序列,根据样本自相关图的性质估计[p]和[q]。各城市时间序列的自相关图见图4。根据自相关系数的截尾情况以及自动定阶的结果可以判断各个城市的日平均气温时间序列适合建立[AR(p)]模型,即气温数据具有明显的自相关性。具体来说,北京可以建立[AR(3)]模型,其他5个城市可以建立[AR(5)]模型。确定模型阶数后,可以对模型中的参数进行估计,具体结果如表3所示。
2. 神经网络。在ARMA模型的基础上,本文分别构建BP神经网络模型和ELM神经网络模型。确定自回归模型的具体阶数后,就可以确定神经网络的输入层。本文以北京第[t-1]天、[t-2]天和[t-3]天气温数据作为输入层,其他城市以第[t-1]天、[t-2]天、[t-3]天、[t-4]天和[t-5]天气温数据作为输入层,以第[t]天气温数据作为输出层,构建神经网络模型。本文尝试设置不同的隐含层个数调试模型,最终确定最佳的隐含层个数。
3. 模型预测及误差分析。通过上述构建的模型,可以将验证集数据代入,以检验模型预测能力。首先,检验ARMA模型的预测能力。ARMA模型预测的各城市2019年日平均气温预测值与实际值对比情况如图5所示,图中虚线代表ARMA模型预测结果,实线代表实际值。由图5可知,ARMA模型对北京、沈阳、上海和延安的日平均气温预测效果较好,但是对广州和重庆日平均气温的预测要低于实际值。由此可见,ARMA模型虽然能大致预测温度走势,但是预测精度有待提升。
其次,检验BP神经网络模型预测能力。BP神经网络模型预测的各城市2019年日平均气温预测值与实际值对比情况如图6所示,图中虚线代表BP神经网络模型预测结果,实线代表实际值。由图可知,BP神经网络对于各城市日平均气温预测结果较为准确,可以清晰地拟合温度变化曲线,但在温度发生频繁波动时,其预测精度会受到影响,导致预测不够精确。这种现象集中出现在高温时段。
最后,检验BLM神经网络模型预测能力。其预测值与实际值对比情况如图7所示,图中虚线代表ELM神经网络模型预测结果,实线代表实际值。由图7可知,ELM神经网络解决了BP神经网络在高温时段预测不准确的问题,且整体预测精度高于BP神经网络。
综上所述,三种模型对于每个城市平均气温数据的预测精度是不同的,为了对比三种模型的预测精度,并验证ELM神经网络是否在气温预测方面性能更优越,本文使用平均绝对误差(MAE)和均方根误差(RMSE)两种测度方法来评价预测精度,具体计算公式如下:
其中,[N]是训练集的长度,[Xi]代表预测的日平均气温,[Yi]代表[t]数据点的实际温度。各城市神经网络预测精度如表4所示。由表可知,三种模型预测精度都比较高,标准误差较小。三种模型对于各个城市日均气温的拟合效果有所不同:对于ARMA模型,上海的预测效果最好,武汉的预测效果最差;而BP神经网络模型对上海的预测效果最好,沈阳的预测效果最差;ELM神经网络模型对重庆的预测效果最好,对沈阳的预测效果最差。总的来说,ELM神经网络的预测结果比ARMA模型和BP神经网络更准确。
四、气温衍生品定价及应用分析
通过合理的气温指数模型对气温进行预测后,就可以根据预测结果进行气温衍生品定价。简单来说,气温指数就是将合约城市的日平均气温进行相关处理得到的指数。下面简单介绍两种常见的气温指数:Heating Degree Day指数简称HDD指数,又称日取暖指数;Cooling Degree Day指数简称CDD指数,又称日制冷指数。
基于HDD指数和CDD指数的天气衍生品广泛运用于农业、能源、旅游、公共事业等行业。例如,极寒天气发生时,如果没有采取任何措施来对冲风险,那么公共事业单位需要承担由极寒天气造成的所有支出。但是如果事业单位提前购买HDD指数天气衍生品,那么就可以有效对冲天气风险。
对于给定的站点,基准温度通常为65华氏度或18摄氏度。HDD是日平均温度低于基准温度的度数,而CDD是日平均气温高于基准温度的度数。简而言之,HDD和CDD的计算如下: 按照上述定义利用蒙特卡洛方法对六个代表城市的HDD看涨期权合约进行定价,具体定价结果如表7所示。
上述六个试点城市的合约可以用来对冲1月份气温低于正常温度的风险,其他气候特征相似的城市若有天气风险管理需求也可以同样定价。表7中,各地区气候类型不同,气温期权价格也不同,可以使用我国标准气候区划方案减少定价时的差异。随着模拟次数增加,各城市期权价格变化趋势如图8所示。经过蒙特卡洛模拟,HDD期权的价格是缓慢收敛的,验证了模型的有效性。CDD指数期权的定价原理与HDD指数相同。
五、结论
本文基于气温的时间序列数据,构建了能够准确刻画气温趋势的ARMA模型、BP神经网络模型和ELM神经网络模型。由于我国土地辽阔,气候多变,所以用上述模型对北京、沈阳、上海、广州、重庆和延安这六个代表城市进行实证分析。模型的拟合和预测效果都比较理想,但相比之下,ELM神经网络的预测效果更好,它可为气温衍生品的定价提供决策参考。
气温衍生品作为管理气候风险的金融创新工具,能有效分散各行业的天气风险,但是我国对于这种金融创新路径的探索和应用都尚未展开。我国的农业、能源业、电力等行业极易受气候影响,对天气衍生品需求巨大。因此,需要大力发展气温指数衍生品合约以满足我国各行业天气风险管理和气候风险管理的需求。
目前我国的天气衍生品市场处于初级阶段,只有大连商品交易所率先针对几个主要城市推出了温度指数。但这几个地区的温度指数无法概括全国的气温特征,也无法满足全国各行各业对天气衍生品的需求。随着我国天气风险对各行各业影响的不断加强,对天气衍生品的需求也不断增大,我们需要根据各个地区不同的气候特征,开发不同的天气衍生品来规避天气风险,以实现国民经济持续稳定发展。
参考文献:
[1]Benth F E,Benth J. 2007. The Volatility of Temperature and Pricing of Weather Derivatives [J].Quantitative Finance,7(5).
[2]Elias R S,Wahab M I M,Fang L. 2014. A Comparison of Regime-Switching Temperature Modeling Approaches for Applications in Weather Derivatives [J].European Journal of Operational Research,232(3).
[3]Gyamerah S A,Ngare P,Ikpe D. 2018. Regime-switching Temperature Dynamics Model for Weather Derivatives [J].International Journal of Stochastic Analysis,1-15.
[4]楊刚,杨徐进. 基于马尔科夫状态转移模型的天气衍生品定价 [J].经济数学,2020,37(2).
[5]Caballero R,Jewson S,Brix A. 2002. Long Memory in Surface Air Temperature:Detection,Modeling,and Application to Weather Derivative Valuation [J].Climate Research, 21(2).
[6]Zhou R,Li J S H,Pai J. 2019. Pricing Temperature Derivatives with a Filtered Historical Simulation Approach[J].The European Journal of Finance,25(15).
[7]侯县平.基于典型事实特征的天气衍生品中气温预测模型研究 [J].统计与管理,2019,(1).
[8]Ah?an A. 2012. Statistical Analysis of Model Risk Concerning Temperature Residuals and its Impact on Pricing Weather Derivatives [J].Insurance:Mathematics and Economics,50(1).
[9]Erhardt R J,Smith R L. 2014. Weather Derivative Risk Measures for Extreme Events [J].North American Actuarial Journal,18(3).
[10]崔海蓉,曹广喜,张京波.高温天气衍生品设计及其定价模型——以长江中下游地区水稻为例 [J].系统工程,2017,35(4).
[11]Fujita H,Mori H. 2012. A Hybrid Intelligent System for Designing a Contract Model for Weather Derivatives[J].Procedia Computer Science,12.
[12]Mori H,Okada M. 2016. An ANN-based Design for Weather Derivatives in Consideration of Meteorological Uncertainties [C].2016 IEEE Innovative Smart Grid Technologies-Asia (ISGT-Asia).IEEE.
[13]Alexandridis A K,Kampouridis M,Cramer S. 2017. A Comparison of Wavelet Networks and Genetic Programming in the Context of Temperature Derivatives [J].International Journal of Forecasting,33(1).
[14]涂春丽,王芳.基于神经网络和蒙特卡罗方法的天气衍生品定价研究 [J].中原工学院学报,2012,23(3).
[15]Guang-Bin Huang,Qin-Yu Zhu,Chee-Kheong Siew. 2005. Extreme Learning Machine:Theory and Applications [J].Neurocomputing,70(1).
[16]徐睿,梁循,齐金山,李志宇,张树森.极限学习机前沿进展与趋势 [J].计算机学报,2019,42(7).