论文部分内容阅读
纵向数据是指对每个个体在不同时间进行观测而得到的由截面和时间序列融合在一起的数据,是目前统计研究的一个热点问题.纵向数据结合了截面数据和时间数据的特征,能更好地分析出样本随时间变化的趋势,同时也能够准确地反映出样本间的差异和样本内的变化,因而具有较高的应用价值.本文重点探讨纵向数据的线性混合效应模型和半参数混合效应模型,主要结构如下:1.简单介绍了纵向数据的定义、纵向数据的特点,及其与时间序列数据、截面数据、多元统计数据的区别,从而看出纵向数据研究的优越性.概括了关于纵向数据国内外的研究现状以及本文将做的工作;2.介绍了纵向数据的线性混合效应模型,讨论了回归参数和方差参数的估计问题,通过Newton-Raphon迭代公式,得到未知方差参数θ的估计;3.主要对部分参数的显著性进行检验,(1)F检验,求出未知参数的最小二乘估计,得到F检验统计量,在原假设为真时, F1 ~ F ( q , N ? np ? q);给定显著性水平α,其拒绝域为: F1 > F1 ?α( q , N ? np ? q);(2)似然比检验(LRT),首先计算出参数的极大似然估计,详细推导出β?和β?λ之间的关系.根据似然比检验统计量的谱表示给出拟合有限样本分布的算法,该算法最大的特点是只需在模拟之前计算出特征值即可,其速度取决于随机效应数q.(3)约束似然比检验(RLRT),通过计算同样得到约束似然比检验统计量的谱表示.最后将上述结论推广至广义线性模型.这些检验计算简单,便于使用.4.着重讨论了半参数回归混合效应模型,利用密度核估计方法来估计未知函数f (? ) ,并采用改进的多元自适应回归样条方法拟合未知的均值函数f (?) .最后我们选择出的模型可以写成线性混合效应模型的形式,同样利用第三章讨论的方法来检验随机效应的存在性.