论文部分内容阅读
摘要时间序列分析如今已经广泛应用于社会科学和自然科学的各个领域。尤其是在金融与宏观经济领域,由于大多数的数据的得到都是按照时间序列来获得的,因此通过时间序列分析从而在统计学意义上处理时间序列数据具有很大的灵活性。时间序列的分析方法很多,本文主要是通过运用Box-Jenkins的方法来分析中国近年来GDP的数据,并且进行一定程度的预测。选取的GDP数据是今年来的季度数据。
关键词Box-Jenkins方法 时间序列分析 季度GDP ARIMA
中图分类号:F222 文献标识码:A
经济学从亚当斯密的《国富论》开始,已经有几个世纪的发展。西方经济学传统上希望将复杂的经济活动用简单而严密的数学公式加以概括,从而可以进行某种类似于物理学意义的归纳和预测。
经济现象虽然在短时间内由于非理性而没有规律,在长时间内则不然,可以找到一定的规律。在20世纪70年代才开始发展和完善的时间序列分析,给这样的经济规律地寻找提供了一种良好的工具。本文中找寻的GDP数据是自2000年以来的季度数据,我这样选取的原因在于第一:社会发展在过于长的时间内或许有失偏颇,因为中国的经济发展十分迅速,而中国入世前后的发展速度又存在着差异性,故而我选取今年以来的数据。第二:年度GDP的数据很多学者都已经进行过研究,而季度数据却很少研究。第三:季度数据在处理中存在着季节因素,这正好可以用时间序列的分析加以消除。
一、Box-Jenkins模型简介
上个世纪70年代,美国学者Box和英国统计学家Jenkins相互合作,开发了一种用于时间序列分析的统计学方法——Box-Jenkins方法。这种方法在用于时间序列数据的处理和预测中主要有三个步骤:一,取得时间序列数据,若数据是平稳的,则只需将数据略微修改;若序列是非平稳的数据,则需要将数据通过变换改成平稳的序列而同时不改变统计性质和意义。二,将处理过的平稳数据应用于模型中并且进行参数估计。三,将所得的模型用于预测。当然,预测时随着时间的长短在预测精度上会有较大的差异,这也是这一模型的缺陷所在,但是就短期的预测而言,精度还是较高的。
ARMA(p,q)模型是Box-Jenkins方法的主要模型。其数学上的表达式为:
模型中包括了一个AR(p)模型和一个MA(q)模型。其中的c, 和 都是待估计的单数,而 是一个白噪声序列。
ARMA模型要求所取得的时间序列数据是平稳的序列。然而在现实情况中,时间序列数据往往表现出非平稳的性质,另外,数据有时会含有季节因素。这就要求对数据进行处理。在ARMA模型中常常会引入差分法将非平稳序列转变成为平稳序列。于是上述ARMA(p,q)模型又常以ARIMA(p,d,q)的形式出现,称为自回归移动求积平均模型(Autogressive Integrated Moving Average Model)。其中的d代表了差分的阶数。
二、中国季度GDP数据的时间序列分析
(一) 数据来源及处理。
本文选取的数据来自于中国国家统计局,时间选择为自2003年以来的季度数据。
表1
数据来源:中国国家统计局
季度的GDP数据不仅含有上升的趋势,并且还含有季节因素。数据呈现有规律的波动上升趋势。我们再根据其相关性函数图形来判断,在图1中所示的是原始数据的相关函数图。从图中我们可以清楚地看到,自相关函数AC和偏相关函数PAC都在标准差之外,存在着明显的拖尾现象。
图1 季度GDP序列的相关性图
图2 D(loggdp)的单位根检验结果
为了消除该序列的平稳性,现在做一阶差分然后再做ADF检验,其在Eviews中的导出结果如下:
从而可以看到,此时的序列已经通过了t检验,t值明显小于10%显著性水平下的临界值。因而该差分序列D(loggdp)是平稳的序列。将此数据可以用于ARMA模型的分析。
(二)模型的识别与参数估计。
我们知道,从理论上来说,Box-Jenkins方法可以从自相关和偏相关函数的图像中来识别时间序列的阶数,从而建立相应的ARMA模型。一般来说,如果自相关函数(AC)拖尾,而偏相关函数(PAC)截尾,则可以相应的建立AR模型;如果偏相关函数(PAC)拖尾,而自相关函数(AC)截尾,则可以相应的建立MA模型;若是自相关函数和偏相关函数都是拖尾的,那么ARMA模型可以是对应的模型。
在本文选取的数据中,从自相关函数可以看到是拖尾的,而偏相关函数也带有一定的拖尾现象。因此可以考虑用ARMA模型,另外,由于原始的数据是选取的季度数据,因此可以在模型中考虑AR(4)与MA(4)来相应的构造。当然,最后的滞后阶数的选择是需要根据统计意义上的相应统计量来判定,比如AIC与SIC是两个重要的统计量,AIC与SIC最小的模型即为最佳的预测模型。
在对序列进行了ARIMA(1,1,1),ARIMA(2,1,1),ARIMA(1.1,2) 以及ARIMA(4,1,2) ARIMA(4,1,4)等分别进行了估计之后,发现ARIMA(4,1,2)是符合统计意义上的最佳预测。在Eviews5中导出了以下的结果:
图3 ARIMA(4,1,2)模型的统计结果 图4 差分序列模型残差的相关函数图
从上述的统计结果中可以看到,当用了一阶差分之后,模型通过了t检验,并且D-W值也拟合的很好。
进一步考察此时残差的ADF检验,结果如下图所示:可以看到自相关函数AC和偏相关函数都在标准差之内。因此可以说明,ARIMA(4,1,2)是一种较为合理的预测模型。
由此可以推出,中国季度GDP模型的数学表达式为:
(三) 模型的实用性检验。
对于上述得到的模型,可以将其进行预测。因为经济模型的作用本身在于使得人们可以从过去的经济活动中获得经济规律,并且能在人们以后的行为和决策中提供一种理性的选择。且不论实际与模型会有多大程度的符合,光就目的而言预测是必须的。而经济科学之所以同物理学不一样,就在于经济活动是由人来完成的。而人作为一种复杂的生物体,在行为的时候不像物体那般永恒不变,因此经济模型与实际难免会有偏差。时间序列模型ARIMA也是如此,预测值与实际值往往并不一致。但是,经济研究可以提供一种大致的框架,使得人们在进行经济决策时不至于茫然而不知所措。
下面对于本文所得到的ARIMA(4,1,2)模型进行2009年四个季度GDP值的预测。用Eviews进行预测得到的图形如图所示。而2009年前三个季度的实际GDP值如表2所示。
从下图的预测值中来看,实际对数GDP与预测对数GDP虽然有一定的差异,但是差异性并不是很大。每个时点的预测值比实际值大概大0.02左右。
我们有理由相信,ARIMA(4,1,2)可以作为中国季度GDP的预测模型。
图5 模型预测值图6残差的符合情况
从上面的图形中我们可以看到,模型在对2004年至2009年的季度GDP的估计中是基本上相符的。因而说明了模型是符合现实情况的。
三、结语
本文运用时间序列分析中的Box-Jenkins方法,用ARIMA(4,1,2)模型对自2000年以来中国的季度GDP数据进行了分析和预测。预测值在短期内是较为接近实际值的,因此模型对于估计2009或者2010年的季度GDP值具有一定的参考价值。虽然在长期中,ARIMA模型的预测值可能并不精确,但是这个缺陷可以在动态的调整下弥补。
ARIMA不仅在GDP等经济科学中应用较为广泛,在其他的自然科学中也很受欢迎。因为ARIMA模型思想的过程清晰,在应用中又可以反复的修改识别,对于p,d,q的确定也很方便,因此ARIMA模型是时间序列分析中的重要的模型,具有广泛推广的价值。
(作者单位:武汉大学经济与管理学院)
参考文献:
[1]何书元.应用时间序列分析. 北京大学出版社.
[2]赵晓葵.基于Box-Jenkins方法的中国年度GDP时间序列分析建模与预测.青海师范大学学报(自然科学版).2003.
[3]周巧.湖北省GDP总量的时间序列预测模型的比较分析.中南财经政法大学研究生学报.2009年第4期.
[4]王晓鹏.曹广超,丁生喜.基于Box-Jenkins方法的青南高原降水量时间序列分析建模与预测.数理统计与管理.2008年7月第4期.
[5]樊亮,常迎香,李菊梅.时间序列分析模型在甘肃省GDP中的应用.甘肃科学学报.2009年12月第4期.
关键词Box-Jenkins方法 时间序列分析 季度GDP ARIMA
中图分类号:F222 文献标识码:A
经济学从亚当斯密的《国富论》开始,已经有几个世纪的发展。西方经济学传统上希望将复杂的经济活动用简单而严密的数学公式加以概括,从而可以进行某种类似于物理学意义的归纳和预测。
经济现象虽然在短时间内由于非理性而没有规律,在长时间内则不然,可以找到一定的规律。在20世纪70年代才开始发展和完善的时间序列分析,给这样的经济规律地寻找提供了一种良好的工具。本文中找寻的GDP数据是自2000年以来的季度数据,我这样选取的原因在于第一:社会发展在过于长的时间内或许有失偏颇,因为中国的经济发展十分迅速,而中国入世前后的发展速度又存在着差异性,故而我选取今年以来的数据。第二:年度GDP的数据很多学者都已经进行过研究,而季度数据却很少研究。第三:季度数据在处理中存在着季节因素,这正好可以用时间序列的分析加以消除。
一、Box-Jenkins模型简介
上个世纪70年代,美国学者Box和英国统计学家Jenkins相互合作,开发了一种用于时间序列分析的统计学方法——Box-Jenkins方法。这种方法在用于时间序列数据的处理和预测中主要有三个步骤:一,取得时间序列数据,若数据是平稳的,则只需将数据略微修改;若序列是非平稳的数据,则需要将数据通过变换改成平稳的序列而同时不改变统计性质和意义。二,将处理过的平稳数据应用于模型中并且进行参数估计。三,将所得的模型用于预测。当然,预测时随着时间的长短在预测精度上会有较大的差异,这也是这一模型的缺陷所在,但是就短期的预测而言,精度还是较高的。
ARMA(p,q)模型是Box-Jenkins方法的主要模型。其数学上的表达式为:
模型中包括了一个AR(p)模型和一个MA(q)模型。其中的c, 和 都是待估计的单数,而 是一个白噪声序列。
ARMA模型要求所取得的时间序列数据是平稳的序列。然而在现实情况中,时间序列数据往往表现出非平稳的性质,另外,数据有时会含有季节因素。这就要求对数据进行处理。在ARMA模型中常常会引入差分法将非平稳序列转变成为平稳序列。于是上述ARMA(p,q)模型又常以ARIMA(p,d,q)的形式出现,称为自回归移动求积平均模型(Autogressive Integrated Moving Average Model)。其中的d代表了差分的阶数。
二、中国季度GDP数据的时间序列分析
(一) 数据来源及处理。
本文选取的数据来自于中国国家统计局,时间选择为自2003年以来的季度数据。
表1
数据来源:中国国家统计局
季度的GDP数据不仅含有上升的趋势,并且还含有季节因素。数据呈现有规律的波动上升趋势。我们再根据其相关性函数图形来判断,在图1中所示的是原始数据的相关函数图。从图中我们可以清楚地看到,自相关函数AC和偏相关函数PAC都在标准差之外,存在着明显的拖尾现象。
图1 季度GDP序列的相关性图
图2 D(loggdp)的单位根检验结果
为了消除该序列的平稳性,现在做一阶差分然后再做ADF检验,其在Eviews中的导出结果如下:
从而可以看到,此时的序列已经通过了t检验,t值明显小于10%显著性水平下的临界值。因而该差分序列D(loggdp)是平稳的序列。将此数据可以用于ARMA模型的分析。
(二)模型的识别与参数估计。
我们知道,从理论上来说,Box-Jenkins方法可以从自相关和偏相关函数的图像中来识别时间序列的阶数,从而建立相应的ARMA模型。一般来说,如果自相关函数(AC)拖尾,而偏相关函数(PAC)截尾,则可以相应的建立AR模型;如果偏相关函数(PAC)拖尾,而自相关函数(AC)截尾,则可以相应的建立MA模型;若是自相关函数和偏相关函数都是拖尾的,那么ARMA模型可以是对应的模型。
在本文选取的数据中,从自相关函数可以看到是拖尾的,而偏相关函数也带有一定的拖尾现象。因此可以考虑用ARMA模型,另外,由于原始的数据是选取的季度数据,因此可以在模型中考虑AR(4)与MA(4)来相应的构造。当然,最后的滞后阶数的选择是需要根据统计意义上的相应统计量来判定,比如AIC与SIC是两个重要的统计量,AIC与SIC最小的模型即为最佳的预测模型。
在对序列进行了ARIMA(1,1,1),ARIMA(2,1,1),ARIMA(1.1,2) 以及ARIMA(4,1,2) ARIMA(4,1,4)等分别进行了估计之后,发现ARIMA(4,1,2)是符合统计意义上的最佳预测。在Eviews5中导出了以下的结果:
图3 ARIMA(4,1,2)模型的统计结果 图4 差分序列模型残差的相关函数图
从上述的统计结果中可以看到,当用了一阶差分之后,模型通过了t检验,并且D-W值也拟合的很好。
进一步考察此时残差的ADF检验,结果如下图所示:可以看到自相关函数AC和偏相关函数都在标准差之内。因此可以说明,ARIMA(4,1,2)是一种较为合理的预测模型。
由此可以推出,中国季度GDP模型的数学表达式为:
(三) 模型的实用性检验。
对于上述得到的模型,可以将其进行预测。因为经济模型的作用本身在于使得人们可以从过去的经济活动中获得经济规律,并且能在人们以后的行为和决策中提供一种理性的选择。且不论实际与模型会有多大程度的符合,光就目的而言预测是必须的。而经济科学之所以同物理学不一样,就在于经济活动是由人来完成的。而人作为一种复杂的生物体,在行为的时候不像物体那般永恒不变,因此经济模型与实际难免会有偏差。时间序列模型ARIMA也是如此,预测值与实际值往往并不一致。但是,经济研究可以提供一种大致的框架,使得人们在进行经济决策时不至于茫然而不知所措。
下面对于本文所得到的ARIMA(4,1,2)模型进行2009年四个季度GDP值的预测。用Eviews进行预测得到的图形如图所示。而2009年前三个季度的实际GDP值如表2所示。
从下图的预测值中来看,实际对数GDP与预测对数GDP虽然有一定的差异,但是差异性并不是很大。每个时点的预测值比实际值大概大0.02左右。
我们有理由相信,ARIMA(4,1,2)可以作为中国季度GDP的预测模型。
图5 模型预测值图6残差的符合情况
从上面的图形中我们可以看到,模型在对2004年至2009年的季度GDP的估计中是基本上相符的。因而说明了模型是符合现实情况的。
三、结语
本文运用时间序列分析中的Box-Jenkins方法,用ARIMA(4,1,2)模型对自2000年以来中国的季度GDP数据进行了分析和预测。预测值在短期内是较为接近实际值的,因此模型对于估计2009或者2010年的季度GDP值具有一定的参考价值。虽然在长期中,ARIMA模型的预测值可能并不精确,但是这个缺陷可以在动态的调整下弥补。
ARIMA不仅在GDP等经济科学中应用较为广泛,在其他的自然科学中也很受欢迎。因为ARIMA模型思想的过程清晰,在应用中又可以反复的修改识别,对于p,d,q的确定也很方便,因此ARIMA模型是时间序列分析中的重要的模型,具有广泛推广的价值。
(作者单位:武汉大学经济与管理学院)
参考文献:
[1]何书元.应用时间序列分析. 北京大学出版社.
[2]赵晓葵.基于Box-Jenkins方法的中国年度GDP时间序列分析建模与预测.青海师范大学学报(自然科学版).2003.
[3]周巧.湖北省GDP总量的时间序列预测模型的比较分析.中南财经政法大学研究生学报.2009年第4期.
[4]王晓鹏.曹广超,丁生喜.基于Box-Jenkins方法的青南高原降水量时间序列分析建模与预测.数理统计与管理.2008年7月第4期.
[5]樊亮,常迎香,李菊梅.时间序列分析模型在甘肃省GDP中的应用.甘肃科学学报.2009年12月第4期.