论文部分内容阅读
纵向数据是对个体在一段时间内的多次观测而得到的数据.对纵向数据来说,通常的一个假定是个体之间的观测认为是独立的,个体内部的观测是相关的.在实际中,由于一些重要变量无法直接观察,或者精确观测,使得对纵向数据的统计分析变得复杂.在实际应用中,得到的纵向数据可能有些协变量包含测量误差,如果测量误差被忽略,那么最终的估计将会变得有偏.众所周知的原因,忽略了测量误差的影响得到的估计足不相合的.本文主要研究纵向数据协变量含有测量误差模型的统计推断问题.主要的工作和研究结果如下 首先,考虑了纵向部分线性模型的统计推断,其中,协变量含有测量误差,同时,还允考虑响应变量缺失的情况,缺失的概率和真实的协变量有关.由于真实的协变量无法直接观测到,因而这里考虑的缺失机制是非随机缺失.用分块经验似然的方法来估计回归参数.这样就使得到了关于回归参数的非参数版本的Wilks定理使用了纠偏的方法构造了关于基准函数的经验似然比并且证明了基于该方法的统计量渐近的服从卡方分布.和正态近似的方法相比,方法不需要方差和偏差的渐近估计,同时不需要低光滑基准函数的估计.还通过模拟和实例来说明所提方法的应用效果. 其次,考虑部分线性模型中回归参数的有效推断的问题.由于内部相关性的存在,经验似然方法不能直接用到纵向数据中.用分块经验似然的方法来估计系数.在估计的过程中,还考虑了工作相关矩阵.对任意工作相关阵,得到了回归系数的非参数版本的Wilks定理.模拟结果显示,正确的指定协方差结构所得的置信区间的长度比工作独立的条件的下得到的区间长度要短.最后,用所提方法分析了一组艾滋病数据. 再次,使用二次推断函数(QIF)的方法考虑纵向线性模型其中协变量含有测量误差的情况.通过最小化二次目标函数来得到参数的估计.所得到的估计具有相合性和渐近正态性.对感兴趣参数的假设检验问题,无论工作相关系数矩阵是否被正确指定,证明了基于二次推断函数的检验统计量渐近服从卡方分布.数值模拟结果显示,当工作相关矩阵被正确指定时,所得的估计最有效.最后,也用所提方法分析实际数据. 最后,研究了纵向数据的一类边际模型,其中协变量含有测量误差.使用模拟插值(SIMEX)的方法来估计回归参数.在SIMEX方法的模拟步骤中,采用了QIF方法.证明了该方法所得估计的近似地渐近服从正态分布.通过数值模拟来考察方法的有限样本的性质.结果表明,方法比忽略了相关结构的条件得分方程方法更有效,当工作相关矩阵被正确指定的时候,所得估计最有效.最后,所提方法被用在对一组艾滋病的数据分析中.