论文部分内容阅读
[摘要]本文通过蒙特卡洛实验,在计量经济学软件R中实现数据生成过程,分别展现平稳时间序列和非平稳时间序列线性回归的OLS参数估计量的分布,运用模拟方法验证“伪回归”现象的存在。
[关键词]时间序列;非平稳;伪回归
Abstract:This paper uses a Monte Carlo experiment to display the distributions of OLS parameter estimators of the linear regression model respectively with stationary time series and non-stationary time series. The existence of spurious regression is confirmed by the simulation, which is realized by using econometric software R.
Keywords:Time series, Non-stationary, Spurious regression
一、引言
在计量经济学的线性回归分析中,对时间序列数据处理往往不同于横截面数据。对于横截面数据,从经验或者经济理论出发,选择其中一个变量作为被解释变量,然后直接对其他变量进行回归,通常采用普通最小二乘法(OLS)对参数进行估计,估计出来的参数被称为OLS参数估计量,再经过一系列统计检验和计量学检验,最终确立变量间的函数关系,从而得到有意义的结论。
而对于时间序列数据,如果所有变量(序列)都是平稳的,则可以直接进行回归;但如果序列是不平稳的,格兰杰[1]提出协整检验方法,即检验序列之间是否存在稳定的关系。协整检验通过以后,才能进行回归,否则会出现“伪回归”现象,即OLS参数估计量不再服从某种既定的分布(例如正态分布),导致基于该分布的统计检验不再可靠,从而影响最终的结论。
第二章简单地介绍一些与时间序列有关的基本概念,为后续的论述打下基础。
第三章数据生成过程,运用一阶自回归模型分别生成两组平稳序列和两组非平稳序列,并分别进行线性回归,研究其OLS参数估计量的分布情况,具体的结论将在第四章中讨论。
二、自回归模型与序列平稳性
在进行数据生成之前,先简单地介绍一下自回归模型以及序列平稳性的有关知识。
四、结论
图1.1展示了两组平稳序列回归的OLS参数估计量的分布情况,初步判断该分布具有正态性。根据图1.2,雅克-贝拉检验的p值为35.24%,大于5%,因而接受正态性假设。
图2.1展示了两组非平稳序列回归的OLS参数估计量的分布情况,明显可以看出该分布偏度较高,初步判断不具有正态性。根据图2.2,雅克-贝拉检验的p值很小,几乎为0,远小于5%,因而拒绝正态性假设。
由此可以看出,如果将两组非平稳序列直接进行回归,会出现“伪回归”现象:OLS参数估计量的分布不再具有正态性,而基于正态性前提的t检验,即参数的显著性检验结果将不再可靠。这就是为什么针对时间序列数据的回归分析,要首先进行协整检验以排除“伪回归”。
参考文献
[1] Engle, R. F. and Granger, C. W. J. Co-integration and error-correction: Representation, estimation and testing[J]. Econometrica, 1987, 55: 251—276.
[关键词]时间序列;非平稳;伪回归
Abstract:This paper uses a Monte Carlo experiment to display the distributions of OLS parameter estimators of the linear regression model respectively with stationary time series and non-stationary time series. The existence of spurious regression is confirmed by the simulation, which is realized by using econometric software R.
Keywords:Time series, Non-stationary, Spurious regression
一、引言
在计量经济学的线性回归分析中,对时间序列数据处理往往不同于横截面数据。对于横截面数据,从经验或者经济理论出发,选择其中一个变量作为被解释变量,然后直接对其他变量进行回归,通常采用普通最小二乘法(OLS)对参数进行估计,估计出来的参数被称为OLS参数估计量,再经过一系列统计检验和计量学检验,最终确立变量间的函数关系,从而得到有意义的结论。
而对于时间序列数据,如果所有变量(序列)都是平稳的,则可以直接进行回归;但如果序列是不平稳的,格兰杰[1]提出协整检验方法,即检验序列之间是否存在稳定的关系。协整检验通过以后,才能进行回归,否则会出现“伪回归”现象,即OLS参数估计量不再服从某种既定的分布(例如正态分布),导致基于该分布的统计检验不再可靠,从而影响最终的结论。
第二章简单地介绍一些与时间序列有关的基本概念,为后续的论述打下基础。
第三章数据生成过程,运用一阶自回归模型分别生成两组平稳序列和两组非平稳序列,并分别进行线性回归,研究其OLS参数估计量的分布情况,具体的结论将在第四章中讨论。
二、自回归模型与序列平稳性
在进行数据生成之前,先简单地介绍一下自回归模型以及序列平稳性的有关知识。
四、结论
图1.1展示了两组平稳序列回归的OLS参数估计量的分布情况,初步判断该分布具有正态性。根据图1.2,雅克-贝拉检验的p值为35.24%,大于5%,因而接受正态性假设。
图2.1展示了两组非平稳序列回归的OLS参数估计量的分布情况,明显可以看出该分布偏度较高,初步判断不具有正态性。根据图2.2,雅克-贝拉检验的p值很小,几乎为0,远小于5%,因而拒绝正态性假设。
由此可以看出,如果将两组非平稳序列直接进行回归,会出现“伪回归”现象:OLS参数估计量的分布不再具有正态性,而基于正态性前提的t检验,即参数的显著性检验结果将不再可靠。这就是为什么针对时间序列数据的回归分析,要首先进行协整检验以排除“伪回归”。
参考文献
[1] Engle, R. F. and Granger, C. W. J. Co-integration and error-correction: Representation, estimation and testing[J]. Econometrica, 1987, 55: 251—276.