论文部分内容阅读
纵向数据是指同一样本或同一组样本在不同时间或空间上进行重复观测而得到的数据,即观测若干次得到的由截面数据和时间数据融合在一起的数据。纵向数据结合了截面数据和时间数据的特征,因而能够更好地分析出样本随时间变化的趋势,同时也能够更准确地反映出样本间的差异和样本内的变化。它的作用是仅仅利用截面数据或时间数据不可替代的,应用价值很高。 纵向数据分析方法主要有参数方法、非参数方法和半参数方法。本文着重探讨的是纵向数据的半参数回归模型,主要工作有: (1) 在合理分析纵向数据本质特征的基础上,全面分析并总结了分析纵向数据常用的参数方法——拟似然估计法、广义估计方程法以及拟最小二乘法,并分别指出了它们的局限性。着重讨论了拟最小二乘估计方程的最优性,并给出了该估计的一个迭代算法。 (2) 针对纵向数据存在严重的相关性而造成的估计系数时的困难,以纵向数据的半参数线性回归模型为例,结合半参数回归模型中的最小二乘核估计法,从理论上构造出纵向数据的半参数线性回归模型的最小二乘核估计法,详细推导了模型中参数β及非参数g(T)相应的最小二乘核估计的求解方程。 (3) 系统地研究了纵向数据的时间变化系数半参数回归模型的系数估计问题。首先用加权最小二乘估计得到β的估计,g(T)用近邻法和核近邻法两个不同的方法进行估计;其次在理论上验证了核近邻法比单一近邻法渐近最优;最后详细推导出渐近最优带宽,证明了近邻法得到的估计θ和β(t)是位置转换不变量。 (4) 数值研究表明,最小二乘核估计法可以很好的解决纵向数据半参数线性回归模型中数据的相关性,拟合效果比较好;加权最小二乘近邻法与加权最小二乘核近邻法对研究纵向数据的时间变化系数半参数回归模型具有可行性和有效性,当样本观测量比较少时,核近邻法比单一近邻法拟合的效果要好,但随着样本观测量的增加,单一近邻法的拟合结果与核近邻法的拟合结果会渐近等价,前者甚至会更好。