论文部分内容阅读
摘 要:分别使用非线性自我激励门限模型(SETAR模型)和线性ARMA模型对股票市场进行比较研究,并运用MAE和RMSE方法比较两者的预测效果,结果表明,通过门限值的控制作用,SETAR模型利用时序数据隐含的时序分段相依性这一重要信息,限制了模型误差,从而比ARMA 模型更适合于描述股票波动的非线性规律。
关键词:SETAR模型;股票波动性;ARMA模型
中图分类号:224.7文献标识码:A文章编号:1672-3198(2008)09-0134-02
0 前言
所谓SETAR模型,是指一种特殊的TAR模型,其阀值的选取是研究变量自身,而不象一般的TAR模型,阀值变量为其他变量。该模型在研究非线性问题上,日益受到国内外学者的重视。
SETAR模型被成功地用来预测一些生物和物理方面的进程, 如预测lysn 数据和太阳黑子的数目(Tong, 1990), 此外该模型在经济和金融方面也得到了广泛的应用。Tiao and Tsay(1994), Potter(1995)运用该模型对美国的GDP 进行了预测; Potter (1995)、Peel and Speight(1995)年分别运用SETAR 模型对美国和英国的GDP进行了预测, 但是运用该模型对股票进行研究的文章一直较少, 作者采用自我激励门限模型——Self- Exciting Threshold Autogressive Model (SETAR) 对股票市场进行研究。除了运用SETAR 模型对股票进行拟合, 还通过与ARMA 模型的比较, 对SETAR 的预测能力进行检验。本文第一部分对该模型进行一般的理论介绍;第二部分运用该模型对股票市场进行拟合与预测,并与一般的ARMA(p,q)模型拟合与预测效果进行比较;最后为结论部分。
1 SETAR模型
通常我们假定一个时间序列{Y}在一个状态空间里,服从线性自回归的特性,然而,实际情况往往并非我们假设的那样,它可能属于两个或更多的空间,这取决于该序列滞后值 ,一般d可以取0,1,…,一直到允许的最大滞后长度。在不同的空间它服从不同的AR(P)过程。例如在两个空间状态的情况下,可以定义一个SETAR(2;P1;P2)模型如下:
上述模型表明该过程在两个状态分别服从AR(P1)过程和AR(P2)过程。
一般可以把上述模型写成以下形式:
我们采用赤池信息准则(Akaike's lnformation Criterion, 简称AIC)。即通过使AIC 取最小值来确定d 和p 的值。Tong(1990)指出此时SETAR 模型的AIC 准则可以通过两个表达式下AR 模型的AIC 准则求和来获得, 即:
AIC(p1,p2)=n1ln1+n2ln2+2(p1+1)+2(p2+1)
其中,j2是第j个分段表达式下残差的方差,r的值的确定可以采取黄金分割法, 所谓黄金分割法, 就是即在搜索过程中通过比较搜索点的函数值。每次均以同等的比率0.618 不断缩小极值点所在的区间, 通过这样不断的缩小区间使之逼近某一值, 该值即为所求的r 值。r 的初始值区间我们可以采用如下做法: 将时间序列yt按照升序进行排序, r 的取值必须满足以下集合r{r|y[π(n-1)]≤r≤y[(1-π)(n-1)]}(其中,π为一个分段表达式的观测值占总的观察值的百分比), 并且π可以比较安全的取得0.15(Franses, Van Dijk, 2000)。计算选择在不同的d,p1,p2和阀值r下回归,以上四个参数的决定遵循以下规则:(1)回归残差不存在自相关;(2)最小AIC准则。
2 实证研究
2.1 数据
本文选取1997年1月1日到2007年12月28日的香港恒生指数, 作为样本(数据来源:聚源数据库),所选用的数据均为收盘价。其中,香港恒生指数共2725个交易数据,令pt为t时的收盘价,定义对数收益率yt=ln(pt/pt-1×100)。
2.2 模型估计
首先对时间序列进行平稳性检验。运用EVIEWS软件进行ADF检验,统计量计算得12.24403,5%显著水平下的临界值等于-2.863176,不能拒绝原假设,该过程为非平稳过程。对该数据进行一次差分后再进行ADF检验,统计量计算得-13.48298,5%显著水平下的临界值等于-2.863182,拒绝原假设,即为平稳过程。通过运用黄金分割法进行搜索,算得香港恒生指数r=0.29875。对于门限变量和滞后期数的确定,我们采取AIC准则,通过选AIC取最小值可知,当门限变量为 滞后期数为1,这时的模型为SETAR(2,5,4)。运用最小二乘法(OLS)对参数进行估计,得到:
对残差做相关性检验,结果如下表
表中给出了从滞后1到15阶自相关检验的Q统计值和假设自相关系数都为0的p值。从结构来看,在5%的显著性水平下,不能拒绝原假设,即所有的自相关系数为0,因而残差不具有自相关性,说明上述SETAR模型p1和p2的选取是合适的。
为了与非线性模型SETAR进行比较,我们采用ARMA(p,q)模型。运用EVIEWS软件进行ADF检验,统计量计算得-7.3049,5%显著水平下的临界值等于-2.8624,拒绝原假设,即为平稳过程。估计方程得:
yt=0.0545-0.3899y-t-1+0.2792y-t-2+0.1858y-t-3+0.2292y-t-4+0.1290y-t-5+εt-0.6170εt-1
2.3 预测能力比较
现考虑SETAR模型的拟合程度以及预测能力的优劣。DaccoandSatchwell(1999)指出预测结果好坏的关键因素是模型的选择,并且进一步指出,即使时间序列本身是由多个门限生成的,对其进行拟合线性模型的绝对误差百分比(MAPE)可能比采用非线性拟合和线性模型的绝对误差百分比(MAPE)要小。因此我们还需要进一步考虑均方根误差率(RMSE)和绝对误差平均MAE ,其中RMSE=1n∑T+nt=T+1(t-yt)2,T表示样本容量,n表示样本外预测期数, 表示预测值, 是真值,RMSE通过若干个预测值对预测的相对误差进行综合评价;MAE=1n∑T+nt=T+1|t-yt|,其中T表示样本容量,n表示样本外预测期数,t表示预测值,yt是真值。RMSE通过若干个预测值对预测的相对误差进行综合评价。
要考察几个模型预测值的准确度,主要看单步预测值的大小,该预测值越小,即MAE和RMSE值越小,模型预测精度就越高。对比分析如下表所示:
从表中我们可以看出,SETAR模型的RMSE和MAE值均比ARMA模型小,因此我们得出SETAR模型的预测能力比ARMA要强。
3 结论
从以上分析可知,用SETAR模型来拟合我国的股票波动,效果明显的优于线性的ARMA(p,q)模型,说明了在不同状态下,股票市场表现出来的性质是不一样的,一般的线性ARMA(p,q)模型则忽略了这种差异, 而SETAR模型准确反映了股票波动的这一特点,这就是用SETAR模型来模拟和预测股票波动性其效果明显优于线性ARMA模型的原因。
门限自回归模型(SETAR)是一种能有效描述具有跳跃性、相依性、谐波等复杂现象的非线性动态系统,门限的控制作用保证了门限自回归模型良好的稳健性和应用性,在各种自然科学和工程领域内,非线性时序预测具有广泛的实用价值。另外,因股市的建模与预测所处理的信息量往往十分庞大,各因素间相关性错综复杂,主次关系变化不定,数量关系难以定量分析,对算法有很高的要求,正是其复杂的非线性特征,使得关于股市的预测往往难如人意,从根本上来说,预测工作往往不是一次就可以完成的。
股票市场呈现非线性也不是一个独立的过程,而是表现相互依存的关系。其原因在于信息是以非线性的方式呈现的。人们也以非线性的方式对信息作反应,股价的波动也呈现非线性,相应地通过股票市场也表现在股价指数上,使得股价的指数所构成的时间序列分析呈现出非线性特征。通过运用SETAR模型对股票的波动性进行拟合具有一定的实用价值,利用该模型对股票市场进行预测具有可行性。
参考文献
[1]袁军. SETAR 模型在GDP 预测中的应用[J].统计与决策,2007,(5).
[2] Tong.H.On a threshold Model[J].Recognition and Signal Processing,1978,16(5).
[3] De Gooijer,J.G.and P.De Bruin. On SETAR Forecasting [J].Statistics and Probability Letters,1997,160(12).
[4] Peel, D.A., and Speight, A.E.H.Thresh0ld Nonlinearities in Output:some International Evidence [J].Applied Economics, 1998,30:323-333.
[5] Potter, S.M..A Nonlinear Approach to U.S.GNP [J].Journal of Applied Econometries, 1995,10:109-125.
[6] 张晓峒. EVIEWS使用指南和案例[M].北京:机械工业出版社,2007,(2).
关键词:SETAR模型;股票波动性;ARMA模型
中图分类号:224.7文献标识码:A文章编号:1672-3198(2008)09-0134-02
0 前言
所谓SETAR模型,是指一种特殊的TAR模型,其阀值的选取是研究变量自身,而不象一般的TAR模型,阀值变量为其他变量。该模型在研究非线性问题上,日益受到国内外学者的重视。
SETAR模型被成功地用来预测一些生物和物理方面的进程, 如预测lysn 数据和太阳黑子的数目(Tong, 1990), 此外该模型在经济和金融方面也得到了广泛的应用。Tiao and Tsay(1994), Potter(1995)运用该模型对美国的GDP 进行了预测; Potter (1995)、Peel and Speight(1995)年分别运用SETAR 模型对美国和英国的GDP进行了预测, 但是运用该模型对股票进行研究的文章一直较少, 作者采用自我激励门限模型——Self- Exciting Threshold Autogressive Model (SETAR) 对股票市场进行研究。除了运用SETAR 模型对股票进行拟合, 还通过与ARMA 模型的比较, 对SETAR 的预测能力进行检验。本文第一部分对该模型进行一般的理论介绍;第二部分运用该模型对股票市场进行拟合与预测,并与一般的ARMA(p,q)模型拟合与预测效果进行比较;最后为结论部分。
1 SETAR模型
通常我们假定一个时间序列{Y}在一个状态空间里,服从线性自回归的特性,然而,实际情况往往并非我们假设的那样,它可能属于两个或更多的空间,这取决于该序列滞后值 ,一般d可以取0,1,…,一直到允许的最大滞后长度。在不同的空间它服从不同的AR(P)过程。例如在两个空间状态的情况下,可以定义一个SETAR(2;P1;P2)模型如下:
上述模型表明该过程在两个状态分别服从AR(P1)过程和AR(P2)过程。
一般可以把上述模型写成以下形式:
我们采用赤池信息准则(Akaike's lnformation Criterion, 简称AIC)。即通过使AIC 取最小值来确定d 和p 的值。Tong(1990)指出此时SETAR 模型的AIC 准则可以通过两个表达式下AR 模型的AIC 准则求和来获得, 即:
AIC(p1,p2)=n1ln1+n2ln2+2(p1+1)+2(p2+1)
其中,j2是第j个分段表达式下残差的方差,r的值的确定可以采取黄金分割法, 所谓黄金分割法, 就是即在搜索过程中通过比较搜索点的函数值。每次均以同等的比率0.618 不断缩小极值点所在的区间, 通过这样不断的缩小区间使之逼近某一值, 该值即为所求的r 值。r 的初始值区间我们可以采用如下做法: 将时间序列yt按照升序进行排序, r 的取值必须满足以下集合r{r|y[π(n-1)]≤r≤y[(1-π)(n-1)]}(其中,π为一个分段表达式的观测值占总的观察值的百分比), 并且π可以比较安全的取得0.15(Franses, Van Dijk, 2000)。计算选择在不同的d,p1,p2和阀值r下回归,以上四个参数的决定遵循以下规则:(1)回归残差不存在自相关;(2)最小AIC准则。
2 实证研究
2.1 数据
本文选取1997年1月1日到2007年12月28日的香港恒生指数, 作为样本(数据来源:聚源数据库),所选用的数据均为收盘价。其中,香港恒生指数共2725个交易数据,令pt为t时的收盘价,定义对数收益率yt=ln(pt/pt-1×100)。
2.2 模型估计
首先对时间序列进行平稳性检验。运用EVIEWS软件进行ADF检验,统计量计算得12.24403,5%显著水平下的临界值等于-2.863176,不能拒绝原假设,该过程为非平稳过程。对该数据进行一次差分后再进行ADF检验,统计量计算得-13.48298,5%显著水平下的临界值等于-2.863182,拒绝原假设,即为平稳过程。通过运用黄金分割法进行搜索,算得香港恒生指数r=0.29875。对于门限变量和滞后期数的确定,我们采取AIC准则,通过选AIC取最小值可知,当门限变量为 滞后期数为1,这时的模型为SETAR(2,5,4)。运用最小二乘法(OLS)对参数进行估计,得到:
对残差做相关性检验,结果如下表
表中给出了从滞后1到15阶自相关检验的Q统计值和假设自相关系数都为0的p值。从结构来看,在5%的显著性水平下,不能拒绝原假设,即所有的自相关系数为0,因而残差不具有自相关性,说明上述SETAR模型p1和p2的选取是合适的。
为了与非线性模型SETAR进行比较,我们采用ARMA(p,q)模型。运用EVIEWS软件进行ADF检验,统计量计算得-7.3049,5%显著水平下的临界值等于-2.8624,拒绝原假设,即为平稳过程。估计方程得:
yt=0.0545-0.3899y-t-1+0.2792y-t-2+0.1858y-t-3+0.2292y-t-4+0.1290y-t-5+εt-0.6170εt-1
2.3 预测能力比较
现考虑SETAR模型的拟合程度以及预测能力的优劣。DaccoandSatchwell(1999)指出预测结果好坏的关键因素是模型的选择,并且进一步指出,即使时间序列本身是由多个门限生成的,对其进行拟合线性模型的绝对误差百分比(MAPE)可能比采用非线性拟合和线性模型的绝对误差百分比(MAPE)要小。因此我们还需要进一步考虑均方根误差率(RMSE)和绝对误差平均MAE ,其中RMSE=1n∑T+nt=T+1(t-yt)2,T表示样本容量,n表示样本外预测期数, 表示预测值, 是真值,RMSE通过若干个预测值对预测的相对误差进行综合评价;MAE=1n∑T+nt=T+1|t-yt|,其中T表示样本容量,n表示样本外预测期数,t表示预测值,yt是真值。RMSE通过若干个预测值对预测的相对误差进行综合评价。
要考察几个模型预测值的准确度,主要看单步预测值的大小,该预测值越小,即MAE和RMSE值越小,模型预测精度就越高。对比分析如下表所示:
从表中我们可以看出,SETAR模型的RMSE和MAE值均比ARMA模型小,因此我们得出SETAR模型的预测能力比ARMA要强。
3 结论
从以上分析可知,用SETAR模型来拟合我国的股票波动,效果明显的优于线性的ARMA(p,q)模型,说明了在不同状态下,股票市场表现出来的性质是不一样的,一般的线性ARMA(p,q)模型则忽略了这种差异, 而SETAR模型准确反映了股票波动的这一特点,这就是用SETAR模型来模拟和预测股票波动性其效果明显优于线性ARMA模型的原因。
门限自回归模型(SETAR)是一种能有效描述具有跳跃性、相依性、谐波等复杂现象的非线性动态系统,门限的控制作用保证了门限自回归模型良好的稳健性和应用性,在各种自然科学和工程领域内,非线性时序预测具有广泛的实用价值。另外,因股市的建模与预测所处理的信息量往往十分庞大,各因素间相关性错综复杂,主次关系变化不定,数量关系难以定量分析,对算法有很高的要求,正是其复杂的非线性特征,使得关于股市的预测往往难如人意,从根本上来说,预测工作往往不是一次就可以完成的。
股票市场呈现非线性也不是一个独立的过程,而是表现相互依存的关系。其原因在于信息是以非线性的方式呈现的。人们也以非线性的方式对信息作反应,股价的波动也呈现非线性,相应地通过股票市场也表现在股价指数上,使得股价的指数所构成的时间序列分析呈现出非线性特征。通过运用SETAR模型对股票的波动性进行拟合具有一定的实用价值,利用该模型对股票市场进行预测具有可行性。
参考文献
[1]袁军. SETAR 模型在GDP 预测中的应用[J].统计与决策,2007,(5).
[2] Tong.H.On a threshold Model[J].Recognition and Signal Processing,1978,16(5).
[3] De Gooijer,J.G.and P.De Bruin. On SETAR Forecasting [J].Statistics and Probability Letters,1997,160(12).
[4] Peel, D.A., and Speight, A.E.H.Thresh0ld Nonlinearities in Output:some International Evidence [J].Applied Economics, 1998,30:323-333.
[5] Potter, S.M..A Nonlinear Approach to U.S.GNP [J].Journal of Applied Econometries, 1995,10:109-125.
[6] 张晓峒. EVIEWS使用指南和案例[M].北京:机械工业出版社,2007,(2).