论文部分内容阅读
纵向数据、复发事件数据和生存数据是纵向研究中三类典型的复杂数据,分析这些复杂数据,建立合理的统计模型并进行统计推断,进而达到解释和预测的目的,能够给我们提供很多有用的信息。因此,研究这些复杂数据不仅具有重要的理论意义,也具有广泛的应用前景。 关于纵向数据的分析,在第二章关于带信息观测和信息删失的纵向数据提出了一种联合建模的分析方法,对纵向过程采用半参数线性回归模型,对观测过程和删失时间采用加速时间模型,并且对联合分布的形式和相依结构不做任何假定。在第三章通过引入潜变量对带信息终止事件的依赖于复发事件的标记数据提出了一个可加可乘均值模型。在这两章中,都通过广义估计方程的方法建立了估计方程,并且建立了所得估计的渐近性质。此外,还提出了一些数值方法用于模型检验。通过模拟研究验证了所提出估计的有限样本性质并将我们的方法应用到弗吉尼亚大学健康系统治疗的慢性心脏衰竭疾病病人的医疗费用数据作为例证。 关于复发事件数据的分析,在第四章我们提出了关于复发间隔时间的一类部分线性转移模型,该模型加入了非线性效应的协变量,从而扩展了线性转移模型,同时该模型包含部分线性比例风险模型和部分线性比例优势模型作为特例。提出了全局和局部的估计方程用来估计参数和非参数协变量效应,并且建立了所得估计的渐近性质。通过模拟研究评估了所提出估计的有限样本性质,并将我们的方法应用于一组膀胱肿瘤数据。 关于生存数据的分析,在第五章研究了带删失生存数据的平均剩余寿命模型的变量选择问题,提出了通过惩罚估计函数的方法同时进行变量选择和回归系数的估计,并证明了通过选择合适的惩罚函数和调谐参数,我们的估计不仅是√n-相合,而且具有Oracle性质。基于局部二次逼近以及BIC-型选择准则,我们提出了一种算法来实现我们所提出的方法。模拟研究表明所提出的方法在变量选择和方差估计方面都表现良好,并将我们的方法用于梅奥诊所的原发性胆汁性肝硬化数据作为例证。