论文部分内容阅读
摘 要:本文在概述时间序列模型种类及特点的基础上,以我国鲜奶零售价格为例,示范了进行农产品市场价格短期预测时选择合适时间序列模型的筛选过程。通过平稳性、季节性、趋势性以及异方差等一系列检验后,本研究最终选择双指数平滑、Holt-Winters无季节性模型和ARCH模型共3种方法对我国鲜奶零售价格短期预测进行了应用模拟,结果显示,ARCH模型预测结果精确度最高,Holt-Winters无季节性模型稳定性最好。
关键词:农产品;价格预测方法;时间序列模型;鲜奶价格
中图分类号:F304.3文献标识号:A文章编号:1001-4942(2010)01-0109-05
Choice and Application of Short-term Forecast Method for Agricultural Products Price——Taking Fresh Milk Retail Price as Example
DONG Xiao-xia, LI Gan-qiong, LIU Zi-jie
(Institute of Agricultural Information, Chinese Academy of Agricultural Sciences/Key Laboratory of
Digital Agricultural Early-warning Technology, Ministry of Agriculture,Beijing 100081, China)
Abstract Based on summarizing the kinds and characteristics of the time series models and taking our country fresh milk retail price as example, the process of choosing the right time series models for short-term forecast of agricultural products price was demonstrated.Checked by stationarity, seasonal characteristic, trend and heteroskedasticity etc., the exponential doubles smoothing, Holt-Winters non-seasonal smoothing and the ARCH modelwere chosen for analyzing the fresh milk retail price. The results indicated that the forecast precision of ARCH model was the best, and the forecast stability of Holt-Winters non-seasonal smoothing was the best.
Key words Agricultural product; Price forecast method; Time series model;Milk price
时间序列分析和预测是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计等方法来建立系统数学模型的理论和方法。时间序列模型是发展较早而且比较成熟的预测方法之一,该模型主要思想是认为同一变量在现在时刻的取值,在时间上同以前的观测值有联系,这种联系可以用一种模型来表示,利用这种模型用现有及以前的序列值可以外推预测目标未来的变化值[1]。
1 时间序列模型的种类时间序列分析与预测方法经过几十年的发展,主要分为线性建模预测和非线性建模预测两种。线性建模预测具体方法包括移动平均法、指数平滑法、趋势外推法、自回归分析法、干预模型预测法和灰色预测法;非线性建模预测主要包括神经网络预测和混沌时间序列预测。
1.1 线性建模预测
1.1.1 移动平均法 基本思路:根据时间序列资料,逐项推移,依次计算包含一定项数的序时平均值,以反映目标未来趋势。移动平均法适用于受周期变动和随机波动影响起伏较大,目标发展趋势不容易显示的情况。移动平均法可以消除这些因素的影响,显示出事件的发展方向与趋势,然后再进行预测[1,3]。移动平均法有两个主要限制:一是必须具有大量历史观测值,二是过去观察值的权数相等。
1.1.2 指数平滑法 基本思路:预测值是以前观测值的加权和,且对于未来将要发生的事物,不同时期的观察值对其影响程度是不同的,最新的观测值被赋予较大的权数,早期观察值被赋予较小的权数。指数平滑法具体方法有一次指数平滑法、线性二次指数平滑法、布朗二次(或高次)多项式指数平滑法、温特线性和季节性指数平滑法。根据时间序列数据的发展趋势可以采用不同的指数平滑法进行预测,如时间序列数据的变化具有线性趋势,为了避免预测值滞后于实际值,应采用线性二次指数平滑法;当数据的基本趋势是非线性的,则可采用布朗二次(或高次)多项式指数平滑法;当数据的变化含有季节性的因素,则应使用把季节性因素考虑在内的温特线性和季节性指数平滑法(Holt-Winters季节调整模型)[1]。
1.1.3 趋势外推法 基本思路:利用函数分析描述预测对象某一参数的发展趋势,通过选择反映时间序列的趋势模型,给定时间变量,外推指标值来预测目标未来数据。当预测对象依时间变化呈现某种上升或下降的趋势,并且无明显的季节波动,又能找到一条合适的函数曲线反映这种变化趋势时,就可以采用趋势外推法(Holt-Winters无季节性模型)[3]。趋势外推法的假设条件较严格,一是假设事物发展过程没有跳跃式变化,一般属于渐进变化;二是假设根据过去资料建立的趋势外推模型能适应未来,能代表未来趋势的变化情况,即未来和过去的规律一样。
1.1.4 自回归分析法 基本思路:利用时间序列数据本身的相互关系,建立回归模型拟合过去信息,进而预测未来。自回归分析法具体方法包括自回归移动平均模型( ARMA)、差分自回归滑动平均模型( ARIMA)、自回归条件异方差模型 (ARCH)等。根据时间序列数据的变动特征可以采用不同的自回归分析法进行模拟和预测,其中自回归移动平均模型适用于均值、方差和协方差等均不随时间变化而变化的平稳时间序列,差分自回归滑动平均模型和自回归条件异方差模型适用于非平稳时间序列,同时差分自回归滑动平均模型要求数据序列不能存在异方差。
1.1.5 干预模型预测法 基本思路:利用受干预影响之前的数据,建立一个单变量的时间序列模型,然后利用此变量进行外推预测,得到的预测值作为不受干预影响的数值,再以实际值减去预测值,得到受干预影响的具体结果,利用这些结果估计干预影响部分的参数,最后结合干预影响参数和排除干预影响后估计出的时间序列模型,求出总的干预分析模型。适用于受政策变化或突发事件影响呈现明显阶段性波动的时间序列数据[4]。
1.1.6 灰色预测法 基本思路:通过鉴别系统因素之间发生趋势的相异程度,进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来的发展趋势的状况。并根据预测的超前时间选择适当长度的原始序列的子序列来建模和预测。灰色预测的建模要求数据序列必须等距,不能有跳跃,且指数趋势变化特征严格。
1.2 非线性建模预测
1.2.1 神经网络预测法 基本思想来源于人类大脑神经运作的模式,是人脑的某种模仿。神经网络预测包括单变量时间序列预测和多变量时间序列预测。神经网络预测法有自适应和学习功能,在实践中一个重要特点是它能把自回归方程中的系数调整成为新的为我们所需要的值。理论已经证明神经网络预测法具有逼近任意函数的能力, 在实践中也能够达到很高的预测精度。但是神经网络预测法也存在一些缺点,如训练速度慢、隐含层点数目难以确定、容易陷入局部极值等[5,6]。
1.2.2 混沌时间序列预测 基本思路:对于任一待预测的向量X来说,如果历史样本点很多的话, 总会有现成的观测点接近预测向量值。混沌时间序列包括全局、局部、半局部建模预测方法,
混沌时间序列往往有很宽的频谱,如果吸引子的维数较低、噪声不大,混沌时间序列预测效果确实比线性模型的预测效果好。一般来说, 局部和半局部方法是最好的,但没有一种非线性方法在各种情况下都是最优的[6]。
2 时间序列模型的选择
对于一个实际观察到的时间序列,我们选择的模型可以不同,但是预测模型选择的正确与否直接关系到预测的准确性、精确性和科学性。实际应用过程中,需要根据实际观察数据的特点,结合预测模型各自独特的原理和运用前提条件,选择合适的运用模型。一般而言,经济指标的月度或季度时间序列包含长期趋势、循环变动、季节变动和不规则波动4种要素。长期趋势代表经济时间序列长期的趋势特性;循环要素是以数年为周期的一种变化,它可能是一种景气变动,也可能是经济变动或其它周期变动;季节变动要素是每年重复出现的循环变动,以12个月或4个季度为周期;不规则要素又称随机因子、残余变动或噪声,这类因素是由偶然发生的事件引起的,经济学分析中,这些要素往往掩盖了经济发展的客观变化,给研究经济发展趋势带来困难[3]。因此,选择合适模型之前,必须对经济时间序列进行分析判断,确认其平稳性、趋势性、季节性、异方差等数据特征。本研究运用STATA 10软件,以2000年1月至2009年10月我国鲜奶零售价格为例进行分析示范。
2.1 平稳性测试
研究采用单位根(ADF)检验鲜奶零售月度价格时间序列的平稳性,确定价格序列最终达到平稳的阶数。如表1所示,水平序列的检验结果中麦金农近似估计值(MacKinnon approximate p-value)为0.7618,接近1,不能拒绝原假设,即鲜奶零售月度价格时间序列数据存在单位根。因此,需要进一步对价格时间序列数据做一阶差分,进而再通过ADF检验来考察该序列是否存在单位根。一阶差分序列的平稳性测试结果见表2:麦金农近似估计值(MacKinnon approximate p-value)为0.0508,拒绝原假设,即鲜奶零售月度价格时间序列数据一阶差分后不存在单位根,已经平稳,因此鲜奶零售月度价格时间序列数据为一阶单整序列。单整序列阶数的确定对自回归分析法中ARMA(p,q)模型、ARIMA(p,d,q)模型以及ARCH(p) 模型中参数估计非常关键。
表1 平稳性测试结果——水平序列
检验统计量1%临界值5%临界值10%临界值
Z(t)-0.976-3.534-2.904-2.587
注:迪基富勒单位根检验;麦金农近似估计值为0.7618。
表2 平稳性测试结果——一阶差分序列
检验统计量1%临界值5%临界值10%临界值
Z(t)-3.405-4.080-3.468-3.161
注:迪基富勒单位根检验;麦金农近似估计值为0.0508。
2.2 趋势性检验
在实证研究当中,价格变化、进出口变化等时间序列数据往往随时间变化有着某种变动(一般是上升)趋势。经济分析中如果忽视了对趋势的考虑,有可能导致变量间关系错误。尤其在回归当中,如果每个变量都随时间增长,那么在多个具有趋势性的变量中找到某种关系的现象就是谬误回归,也称伪回归。因此,在选择时间序列模型前对数据序列的趋势性检验非常必要。本研究采用通用的趋势性检验方法对鲜奶零售月度价格时间序列数据进行检验,即鲜奶价格与时间本身两个变量运用最小二乘法(OLS)看两者的相关程度,如果两者相关系数通过检验,则存在趋势性。表3回归结果中鲜奶价格与时间本身(n)的相关系数为0.0108946,t检验值17.12,可以很明确地得出鲜奶零售价格与时间变量之间存在增长趋势,即随着时间的变化,鲜奶零售价格增长趋势明显。因此,选择时间序列模型时,应该考虑适用于有趋势性的时间序列模型。在做鲜奶零售价格影响因素分析时,也需要在模型回归过程中添加一个趋势变量(时间变量),提升回归结果的可靠性。
表3趋势性检验结果
离差平方和(SS)自由度(df)均方差(MS)
模型15.8404062115.8404062
残差6.213314621150.054028823
合计22.05372081160.190118283
价格系数标准误t值P值[95%置信区间]
时间变量(n)0.01089460.000636317.120.0000.0096343 0.012155
常数项1.6835440.043255338.920.0001.597864 1.769225
注:样本数=117,F=293.18,P=0,R2=0.7183,调整R2=-0.7158,均方的误差=0.23244。
2.3 季节性检验
如果一个时间序列是由定期观测(如每月、每季度等)得到,那么就有可能表现出季节性。如劳动节、国庆节、元旦、春节等假日会使鲜奶零售价格在正常情况下要高于其它月份,从而提高该季度的零售价格。我国奶类消费除受假日因素影响外,季节性变动也特别明显,第一季度和第四季度奶类消费明显高于第二和第三季度。那么鲜奶零售价格是否与我国奶类消费趋势一致,存在明显的季节性,这需要通过计量方法进行检验。季节性检验的一般方法是将时间序列数据与季度虚拟变量进行回归,再进一步对季度虚拟变量做联合显著性检验。表4是鲜奶零售价格与季度虚拟变量的最小二乘法回归结果,可以看到鲜奶零售价格与三个季度虚拟变量之间的相关系数没有一个通过T检验;进一步对季度虚拟变量做联合显著性检验,结果Prob> F=0.9498,进一步说明季节因素对鲜奶月度零售价格不存在影响。
表4季节性检验结果
离差平方和(SS)自由度(df)均方差(MS)
模型0.0684800630.022826687
残差21.98524071130.194559652
合计22.05372081160.190118283
价格系数标准误t值P值[95%置信区间]
2季度虚变量0.02133330.11388870.190.852-0.204301 0.246968
3季度虚变量0.030.11388870.260.793-0.195634 0.255634
4季度虚变量-0.0339630.1170096-0.290.772-0.26578 0.197854
常数项2.3210.080531528.820.0002.161453 2.480547
注:样本数=117,F=0.12,P=0.9498,R2=0.0031,调整R2=-0.0234,均方的误差=0.44109。
季度虚拟变量联合显著性检验结果:
(1)2季度虚变量=0
(2)3季度虚变量=0
(3)4季度虚变量=0
F=0.12
P(Prob> F=0.9498)
2.4 异方差检验
对于非平稳时间序列,我们初步可以判断鲜奶零售价格时间序列可以运用差分自回归滑动平均模型(ARIMA)或自回归条件异方差模型(ARCH)。具体采用哪一种方法更精确更合理,本研究需要对鲜奶零售价格进一步进行异方差检验,当时间序列数据不存在异方差时,采用ARIMA模型;当时间序列数据存在异方差时,采用ARCH模型。下面是对鲜奶零售价格数据进行异方差检验的过程和结果。首先获得当期鲜奶零售价格与其滞后一期价格的相关性(表5),然后观测因变量拟和值与残差值之间的关系(图2),进一步采用Breusch-Pagan异方差检验,检验结果中Prob>chi2=0.0003,可以确认存在异方差。由于默认的Breusch-Pagan异方差检验仅可以检验与X相关的异方差,无法检验更高次的异方差,所以进一步采取White检验,通过White检验结果(表6)可以发现仍然存在异方差。
表5异方差检验结果
离差平方和(SS)自由度(df)均方差(MS)
模型21.71339121.71339
残差0.181903361140.001595644
合计21.89529331150.190393855
价格系数标准误t值P值[95%置信区间]
滞后一期价格1.0140220.0086926116.650.0000.9968016 1.031242
常数项-0.02077840.0204882-1.010.313-0.061365 0.019809注:样本数=116,F=13607.92,Prob>F=0,R2=0.9917,调整R2=0.9916,均方的误差=0.03995。
图1 因变量拟和值与残差值之间的关系
布鲁薛-培根(Breusch-Pagan)异方差检验结果:
原假设:不存在异方差(Ho: Constant variance)
变量:价格拟合值(Variables: fitted values of price)
χ2=12.08(chi2(1)=12.80)
P=0.0003(Prob>chi2=0.0003)
表6White检验结果
χ2值(chi2)自由度(df)P值
异方差系数10.9620.0042
偏度系数4.9310.0264
峰度系数1.7410.1867
合计17.6440.0015
综合上述分析可以确定,新世纪以来我国监测城市鲜奶零售月度价格得到的数据是非平稳时间序列。鲜奶零售价格的波动呈现明显时间趋势性,但季节性波动不明显。鲜奶价格时间序列模型中扰动项方差稳定性较差,大的及小的预测误差常常会成群出现,即存在异方差。因此,根据上述数据特点,结合不同时间序列模型的适用范围(表7),实证研究中鲜奶零售价格预测采用了双指数平滑、Holt-Winters无季节性模型和ARCH模型共3种方法进行了模拟。其中,双指数平滑方法进行两次单指数平滑(使用相同参数),适用于有线性趋势的序列;Holt-Winters无季节性模型适用于具有线性时间趋势但无季节性的序列,与双指数平滑法一样,这种方法以线性趋势进行预测,但不同的是双指数平滑方法只用一个参数,Holt-Winters无季节性模型用两个参数;ARCH模型是为了刻画预测误差的条件方差中可能存在的某种关系,与ARIMA模型一致,它们均属于非平稳时间序列模型,不同的是ARIMA模型要求时间序列不存在异方差,ARCH模型主要思想是当期扰动项的条件方差依赖于它的前期扰动项的大小。
表7 时间序列模型的适用范围及选择
模型平稳性趋势性季节性异方差性选择
单指数平滑-无无-
双指数平滑-有--√
Holt-Winters无季节性模型-有无-√
Holt-Winters季节调整模型-有有-
ARMA模型有--无
ARIMA模型无--无
ARCH模型无--有√
3 时间序列模型的应用
表8中是采用双指数平滑、Holt-Winters无季节性模型和ARCH模型3种时间序列分析与预测方法对我国鲜奶零售价格进行模拟后拟合值与实际值之间残差的比较。拟合结果显示,对我国鲜奶零售价格而言,ARCH模型预测结果精确
表8三种短期预测方法拟合值与实际值之间残差比较
模型观察值均值标准差最小值最大值
双指数平滑1170.02762410.0416499-0.22002260.1118966
Holt-Winters 无季节性模型1170.02791080.0385302-0.12604190.1295652
ARCH模型1160.02669100.0401481-0.21491240.0840648
度最高,残差均值为0.0266910,标准差为0.0401481;Holt-Winters无季节性模型稳定性最好,标准差为0.0385302,明显低于双指数平滑和ARCH模型的标准差值,但其误差均值较大。
为了进一步考察不同方法的稳定性、精确性,本研究重点分析了2009年1月至10月不同预测方法在鲜奶零售价格短期预测中的应用,观察预测值与实际值之间的误差。表9是3种短期预测方法的预测结果与实际监测价格的比较,通过比较发现,与表8研究结论一致,Holt-Winters无季节性模型和ARCH模型的预测结果要明显好于双指数平滑,Holt-Winters无季节性模型平均残差为0.0230,ARCH模型平均残差为0.0217,ARCH模型预测精确度最高。
表9 不同短期预测方法的预测结果及其比较
月份实际监测价格双指数平滑Holt-Winters无季节性模型ARCH模型
13.243.253.263.26
23.253.243.253.25
33.263.253.263.26
43.273.263.273.27
53.303.273.283.28
63.253.303.323.30
73.223.253.253.26
83.263.223.213.23
93.293.263.263.27
103.313.293.303.29
113.303.293.313.32
平均残差-0.0240010.02300.0217
参 考 文 献:
[1] 伍德里奇.计量经济学导论[M].北京:中国人民大学出版社,2003,297-333.
[2] 赫尔穆特•鲁克波尔,马库斯•克莱茨希.应用时间序列计量经济学[M].北京:机械工业出版社,2008,6-54.
[3] 高铁梅. 计量经济分析方法与建模[M].北京:清华大学出版社,2006,133-152.
[4] 徐国祥.统计预测方法的特点研究[J].统计研究,1999,2:52-56.
[5] 张大海,毕研秋,毕研霞,等.基于串联灰色神经网络的电力负荷预测方法[J].系统工程理论与实践,2004,12:128-132.
[6] 温 权,张勇传,程时杰.混沌时间序列预测技术[J].水电能源科学,2001,3:76-78.
关键词:农产品;价格预测方法;时间序列模型;鲜奶价格
中图分类号:F304.3文献标识号:A文章编号:1001-4942(2010)01-0109-05
Choice and Application of Short-term Forecast Method for Agricultural Products Price——Taking Fresh Milk Retail Price as Example
DONG Xiao-xia, LI Gan-qiong, LIU Zi-jie
(Institute of Agricultural Information, Chinese Academy of Agricultural Sciences/Key Laboratory of
Digital Agricultural Early-warning Technology, Ministry of Agriculture,Beijing 100081, China)
Abstract Based on summarizing the kinds and characteristics of the time series models and taking our country fresh milk retail price as example, the process of choosing the right time series models for short-term forecast of agricultural products price was demonstrated.Checked by stationarity, seasonal characteristic, trend and heteroskedasticity etc., the exponential doubles smoothing, Holt-Winters non-seasonal smoothing and the ARCH modelwere chosen for analyzing the fresh milk retail price. The results indicated that the forecast precision of ARCH model was the best, and the forecast stability of Holt-Winters non-seasonal smoothing was the best.
Key words Agricultural product; Price forecast method; Time series model;Milk price
时间序列分析和预测是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计等方法来建立系统数学模型的理论和方法。时间序列模型是发展较早而且比较成熟的预测方法之一,该模型主要思想是认为同一变量在现在时刻的取值,在时间上同以前的观测值有联系,这种联系可以用一种模型来表示,利用这种模型用现有及以前的序列值可以外推预测目标未来的变化值[1]。
1 时间序列模型的种类时间序列分析与预测方法经过几十年的发展,主要分为线性建模预测和非线性建模预测两种。线性建模预测具体方法包括移动平均法、指数平滑法、趋势外推法、自回归分析法、干预模型预测法和灰色预测法;非线性建模预测主要包括神经网络预测和混沌时间序列预测。
1.1 线性建模预测
1.1.1 移动平均法 基本思路:根据时间序列资料,逐项推移,依次计算包含一定项数的序时平均值,以反映目标未来趋势。移动平均法适用于受周期变动和随机波动影响起伏较大,目标发展趋势不容易显示的情况。移动平均法可以消除这些因素的影响,显示出事件的发展方向与趋势,然后再进行预测[1,3]。移动平均法有两个主要限制:一是必须具有大量历史观测值,二是过去观察值的权数相等。
1.1.2 指数平滑法 基本思路:预测值是以前观测值的加权和,且对于未来将要发生的事物,不同时期的观察值对其影响程度是不同的,最新的观测值被赋予较大的权数,早期观察值被赋予较小的权数。指数平滑法具体方法有一次指数平滑法、线性二次指数平滑法、布朗二次(或高次)多项式指数平滑法、温特线性和季节性指数平滑法。根据时间序列数据的发展趋势可以采用不同的指数平滑法进行预测,如时间序列数据的变化具有线性趋势,为了避免预测值滞后于实际值,应采用线性二次指数平滑法;当数据的基本趋势是非线性的,则可采用布朗二次(或高次)多项式指数平滑法;当数据的变化含有季节性的因素,则应使用把季节性因素考虑在内的温特线性和季节性指数平滑法(Holt-Winters季节调整模型)[1]。
1.1.3 趋势外推法 基本思路:利用函数分析描述预测对象某一参数的发展趋势,通过选择反映时间序列的趋势模型,给定时间变量,外推指标值来预测目标未来数据。当预测对象依时间变化呈现某种上升或下降的趋势,并且无明显的季节波动,又能找到一条合适的函数曲线反映这种变化趋势时,就可以采用趋势外推法(Holt-Winters无季节性模型)[3]。趋势外推法的假设条件较严格,一是假设事物发展过程没有跳跃式变化,一般属于渐进变化;二是假设根据过去资料建立的趋势外推模型能适应未来,能代表未来趋势的变化情况,即未来和过去的规律一样。
1.1.4 自回归分析法 基本思路:利用时间序列数据本身的相互关系,建立回归模型拟合过去信息,进而预测未来。自回归分析法具体方法包括自回归移动平均模型( ARMA)、差分自回归滑动平均模型( ARIMA)、自回归条件异方差模型 (ARCH)等。根据时间序列数据的变动特征可以采用不同的自回归分析法进行模拟和预测,其中自回归移动平均模型适用于均值、方差和协方差等均不随时间变化而变化的平稳时间序列,差分自回归滑动平均模型和自回归条件异方差模型适用于非平稳时间序列,同时差分自回归滑动平均模型要求数据序列不能存在异方差。
1.1.5 干预模型预测法 基本思路:利用受干预影响之前的数据,建立一个单变量的时间序列模型,然后利用此变量进行外推预测,得到的预测值作为不受干预影响的数值,再以实际值减去预测值,得到受干预影响的具体结果,利用这些结果估计干预影响部分的参数,最后结合干预影响参数和排除干预影响后估计出的时间序列模型,求出总的干预分析模型。适用于受政策变化或突发事件影响呈现明显阶段性波动的时间序列数据[4]。
1.1.6 灰色预测法 基本思路:通过鉴别系统因素之间发生趋势的相异程度,进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来的发展趋势的状况。并根据预测的超前时间选择适当长度的原始序列的子序列来建模和预测。灰色预测的建模要求数据序列必须等距,不能有跳跃,且指数趋势变化特征严格。
1.2 非线性建模预测
1.2.1 神经网络预测法 基本思想来源于人类大脑神经运作的模式,是人脑的某种模仿。神经网络预测包括单变量时间序列预测和多变量时间序列预测。神经网络预测法有自适应和学习功能,在实践中一个重要特点是它能把自回归方程中的系数调整成为新的为我们所需要的值。理论已经证明神经网络预测法具有逼近任意函数的能力, 在实践中也能够达到很高的预测精度。但是神经网络预测法也存在一些缺点,如训练速度慢、隐含层点数目难以确定、容易陷入局部极值等[5,6]。
1.2.2 混沌时间序列预测 基本思路:对于任一待预测的向量X来说,如果历史样本点很多的话, 总会有现成的观测点接近预测向量值。混沌时间序列包括全局、局部、半局部建模预测方法,
混沌时间序列往往有很宽的频谱,如果吸引子的维数较低、噪声不大,混沌时间序列预测效果确实比线性模型的预测效果好。一般来说, 局部和半局部方法是最好的,但没有一种非线性方法在各种情况下都是最优的[6]。
2 时间序列模型的选择
对于一个实际观察到的时间序列,我们选择的模型可以不同,但是预测模型选择的正确与否直接关系到预测的准确性、精确性和科学性。实际应用过程中,需要根据实际观察数据的特点,结合预测模型各自独特的原理和运用前提条件,选择合适的运用模型。一般而言,经济指标的月度或季度时间序列包含长期趋势、循环变动、季节变动和不规则波动4种要素。长期趋势代表经济时间序列长期的趋势特性;循环要素是以数年为周期的一种变化,它可能是一种景气变动,也可能是经济变动或其它周期变动;季节变动要素是每年重复出现的循环变动,以12个月或4个季度为周期;不规则要素又称随机因子、残余变动或噪声,这类因素是由偶然发生的事件引起的,经济学分析中,这些要素往往掩盖了经济发展的客观变化,给研究经济发展趋势带来困难[3]。因此,选择合适模型之前,必须对经济时间序列进行分析判断,确认其平稳性、趋势性、季节性、异方差等数据特征。本研究运用STATA 10软件,以2000年1月至2009年10月我国鲜奶零售价格为例进行分析示范。
2.1 平稳性测试
研究采用单位根(ADF)检验鲜奶零售月度价格时间序列的平稳性,确定价格序列最终达到平稳的阶数。如表1所示,水平序列的检验结果中麦金农近似估计值(MacKinnon approximate p-value)为0.7618,接近1,不能拒绝原假设,即鲜奶零售月度价格时间序列数据存在单位根。因此,需要进一步对价格时间序列数据做一阶差分,进而再通过ADF检验来考察该序列是否存在单位根。一阶差分序列的平稳性测试结果见表2:麦金农近似估计值(MacKinnon approximate p-value)为0.0508,拒绝原假设,即鲜奶零售月度价格时间序列数据一阶差分后不存在单位根,已经平稳,因此鲜奶零售月度价格时间序列数据为一阶单整序列。单整序列阶数的确定对自回归分析法中ARMA(p,q)模型、ARIMA(p,d,q)模型以及ARCH(p) 模型中参数估计非常关键。
表1 平稳性测试结果——水平序列
检验统计量1%临界值5%临界值10%临界值
Z(t)-0.976-3.534-2.904-2.587
注:迪基富勒单位根检验;麦金农近似估计值为0.7618。
表2 平稳性测试结果——一阶差分序列
检验统计量1%临界值5%临界值10%临界值
Z(t)-3.405-4.080-3.468-3.161
注:迪基富勒单位根检验;麦金农近似估计值为0.0508。
2.2 趋势性检验
在实证研究当中,价格变化、进出口变化等时间序列数据往往随时间变化有着某种变动(一般是上升)趋势。经济分析中如果忽视了对趋势的考虑,有可能导致变量间关系错误。尤其在回归当中,如果每个变量都随时间增长,那么在多个具有趋势性的变量中找到某种关系的现象就是谬误回归,也称伪回归。因此,在选择时间序列模型前对数据序列的趋势性检验非常必要。本研究采用通用的趋势性检验方法对鲜奶零售月度价格时间序列数据进行检验,即鲜奶价格与时间本身两个变量运用最小二乘法(OLS)看两者的相关程度,如果两者相关系数通过检验,则存在趋势性。表3回归结果中鲜奶价格与时间本身(n)的相关系数为0.0108946,t检验值17.12,可以很明确地得出鲜奶零售价格与时间变量之间存在增长趋势,即随着时间的变化,鲜奶零售价格增长趋势明显。因此,选择时间序列模型时,应该考虑适用于有趋势性的时间序列模型。在做鲜奶零售价格影响因素分析时,也需要在模型回归过程中添加一个趋势变量(时间变量),提升回归结果的可靠性。
表3趋势性检验结果
离差平方和(SS)自由度(df)均方差(MS)
模型15.8404062115.8404062
残差6.213314621150.054028823
合计22.05372081160.190118283
价格系数标准误t值P值[95%置信区间]
时间变量(n)0.01089460.000636317.120.0000.0096343 0.012155
常数项1.6835440.043255338.920.0001.597864 1.769225
注:样本数=117,F=293.18,P=0,R2=0.7183,调整R2=-0.7158,均方的误差=0.23244。
2.3 季节性检验
如果一个时间序列是由定期观测(如每月、每季度等)得到,那么就有可能表现出季节性。如劳动节、国庆节、元旦、春节等假日会使鲜奶零售价格在正常情况下要高于其它月份,从而提高该季度的零售价格。我国奶类消费除受假日因素影响外,季节性变动也特别明显,第一季度和第四季度奶类消费明显高于第二和第三季度。那么鲜奶零售价格是否与我国奶类消费趋势一致,存在明显的季节性,这需要通过计量方法进行检验。季节性检验的一般方法是将时间序列数据与季度虚拟变量进行回归,再进一步对季度虚拟变量做联合显著性检验。表4是鲜奶零售价格与季度虚拟变量的最小二乘法回归结果,可以看到鲜奶零售价格与三个季度虚拟变量之间的相关系数没有一个通过T检验;进一步对季度虚拟变量做联合显著性检验,结果Prob> F=0.9498,进一步说明季节因素对鲜奶月度零售价格不存在影响。
表4季节性检验结果
离差平方和(SS)自由度(df)均方差(MS)
模型0.0684800630.022826687
残差21.98524071130.194559652
合计22.05372081160.190118283
价格系数标准误t值P值[95%置信区间]
2季度虚变量0.02133330.11388870.190.852-0.204301 0.246968
3季度虚变量0.030.11388870.260.793-0.195634 0.255634
4季度虚变量-0.0339630.1170096-0.290.772-0.26578 0.197854
常数项2.3210.080531528.820.0002.161453 2.480547
注:样本数=117,F=0.12,P=0.9498,R2=0.0031,调整R2=-0.0234,均方的误差=0.44109。
季度虚拟变量联合显著性检验结果:
(1)2季度虚变量=0
(2)3季度虚变量=0
(3)4季度虚变量=0
F=0.12
P(Prob> F=0.9498)
2.4 异方差检验
对于非平稳时间序列,我们初步可以判断鲜奶零售价格时间序列可以运用差分自回归滑动平均模型(ARIMA)或自回归条件异方差模型(ARCH)。具体采用哪一种方法更精确更合理,本研究需要对鲜奶零售价格进一步进行异方差检验,当时间序列数据不存在异方差时,采用ARIMA模型;当时间序列数据存在异方差时,采用ARCH模型。下面是对鲜奶零售价格数据进行异方差检验的过程和结果。首先获得当期鲜奶零售价格与其滞后一期价格的相关性(表5),然后观测因变量拟和值与残差值之间的关系(图2),进一步采用Breusch-Pagan异方差检验,检验结果中Prob>chi2=0.0003,可以确认存在异方差。由于默认的Breusch-Pagan异方差检验仅可以检验与X相关的异方差,无法检验更高次的异方差,所以进一步采取White检验,通过White检验结果(表6)可以发现仍然存在异方差。
表5异方差检验结果
离差平方和(SS)自由度(df)均方差(MS)
模型21.71339121.71339
残差0.181903361140.001595644
合计21.89529331150.190393855
价格系数标准误t值P值[95%置信区间]
滞后一期价格1.0140220.0086926116.650.0000.9968016 1.031242
常数项-0.02077840.0204882-1.010.313-0.061365 0.019809注:样本数=116,F=13607.92,Prob>F=0,R2=0.9917,调整R2=0.9916,均方的误差=0.03995。
图1 因变量拟和值与残差值之间的关系
布鲁薛-培根(Breusch-Pagan)异方差检验结果:
原假设:不存在异方差(Ho: Constant variance)
变量:价格拟合值(Variables: fitted values of price)
χ2=12.08(chi2(1)=12.80)
P=0.0003(Prob>chi2=0.0003)
表6White检验结果
χ2值(chi2)自由度(df)P值
异方差系数10.9620.0042
偏度系数4.9310.0264
峰度系数1.7410.1867
合计17.6440.0015
综合上述分析可以确定,新世纪以来我国监测城市鲜奶零售月度价格得到的数据是非平稳时间序列。鲜奶零售价格的波动呈现明显时间趋势性,但季节性波动不明显。鲜奶价格时间序列模型中扰动项方差稳定性较差,大的及小的预测误差常常会成群出现,即存在异方差。因此,根据上述数据特点,结合不同时间序列模型的适用范围(表7),实证研究中鲜奶零售价格预测采用了双指数平滑、Holt-Winters无季节性模型和ARCH模型共3种方法进行了模拟。其中,双指数平滑方法进行两次单指数平滑(使用相同参数),适用于有线性趋势的序列;Holt-Winters无季节性模型适用于具有线性时间趋势但无季节性的序列,与双指数平滑法一样,这种方法以线性趋势进行预测,但不同的是双指数平滑方法只用一个参数,Holt-Winters无季节性模型用两个参数;ARCH模型是为了刻画预测误差的条件方差中可能存在的某种关系,与ARIMA模型一致,它们均属于非平稳时间序列模型,不同的是ARIMA模型要求时间序列不存在异方差,ARCH模型主要思想是当期扰动项的条件方差依赖于它的前期扰动项的大小。
表7 时间序列模型的适用范围及选择
模型平稳性趋势性季节性异方差性选择
单指数平滑-无无-
双指数平滑-有--√
Holt-Winters无季节性模型-有无-√
Holt-Winters季节调整模型-有有-
ARMA模型有--无
ARIMA模型无--无
ARCH模型无--有√
3 时间序列模型的应用
表8中是采用双指数平滑、Holt-Winters无季节性模型和ARCH模型3种时间序列分析与预测方法对我国鲜奶零售价格进行模拟后拟合值与实际值之间残差的比较。拟合结果显示,对我国鲜奶零售价格而言,ARCH模型预测结果精确
表8三种短期预测方法拟合值与实际值之间残差比较
模型观察值均值标准差最小值最大值
双指数平滑1170.02762410.0416499-0.22002260.1118966
Holt-Winters 无季节性模型1170.02791080.0385302-0.12604190.1295652
ARCH模型1160.02669100.0401481-0.21491240.0840648
度最高,残差均值为0.0266910,标准差为0.0401481;Holt-Winters无季节性模型稳定性最好,标准差为0.0385302,明显低于双指数平滑和ARCH模型的标准差值,但其误差均值较大。
为了进一步考察不同方法的稳定性、精确性,本研究重点分析了2009年1月至10月不同预测方法在鲜奶零售价格短期预测中的应用,观察预测值与实际值之间的误差。表9是3种短期预测方法的预测结果与实际监测价格的比较,通过比较发现,与表8研究结论一致,Holt-Winters无季节性模型和ARCH模型的预测结果要明显好于双指数平滑,Holt-Winters无季节性模型平均残差为0.0230,ARCH模型平均残差为0.0217,ARCH模型预测精确度最高。
表9 不同短期预测方法的预测结果及其比较
月份实际监测价格双指数平滑Holt-Winters无季节性模型ARCH模型
13.243.253.263.26
23.253.243.253.25
33.263.253.263.26
43.273.263.273.27
53.303.273.283.28
63.253.303.323.30
73.223.253.253.26
83.263.223.213.23
93.293.263.263.27
103.313.293.303.29
113.303.293.313.32
平均残差-0.0240010.02300.0217
参 考 文 献:
[1] 伍德里奇.计量经济学导论[M].北京:中国人民大学出版社,2003,297-333.
[2] 赫尔穆特•鲁克波尔,马库斯•克莱茨希.应用时间序列计量经济学[M].北京:机械工业出版社,2008,6-54.
[3] 高铁梅. 计量经济分析方法与建模[M].北京:清华大学出版社,2006,133-152.
[4] 徐国祥.统计预测方法的特点研究[J].统计研究,1999,2:52-56.
[5] 张大海,毕研秋,毕研霞,等.基于串联灰色神经网络的电力负荷预测方法[J].系统工程理论与实践,2004,12:128-132.
[6] 温 权,张勇传,程时杰.混沌时间序列预测技术[J].水电能源科学,2001,3:76-78.