论文部分内容阅读
失效时间数据和复发事件数据是生存分析中两类非常重要的数据类型.这两类数据经常出现在生物、医学、工程等研究领域.本文研究了失效时间数据和复发事件数据中的若干统计问题.
一方面、本文研究了带缺失数据的失效时间数据的半参数比例平均剩余寿命模型的若干问题,主要包括:
(1)研究了协变量随机缺失时半参数比例平均剩余寿命模型的估计问题.通过非参数核估计的方法,给出了未知的观测概率和若干未知的条件期望的估计,从而给出了简单的和扩张的逆概率加权估计.我们发现缺失概率用估计值代替时,简单的和扩张的逆概率加权估计效率是相同的,但都要好于缺失概率用真值的简单的逆概率加权估计,而缺失概率用真值的扩张的逆概率加权估计和前面两者效率相同;
(2)研究了删失指示变量随机缺失时半参数比例平均剩余寿命模型的估计问题,在研究失效时间数据时,我们经常会丢失删失指示变量,例如竞争风险数据的情况.相似于第一部分,通过非参数的方法,给出了参数的简单的和扩张的逆概率加权估计.我们发现缺失概率用估计值代替时,简单的和扩张的逆概率加权估计效率是相同的.
另一方面,本文研究了复发事件数据的加性比率模型的若干问题,主要包括:
(3)研究了复发事件的部分时间变系数加性比率模型的统计推断.把一般的加性比率模型推广到了带时间变系数的加性比率模型,通过广义估计方程的方法给出了累积时间变系数和常系数的估计,并给出了模型检验的方法;
(4)研究了多类型复发事件的加性比率模型的统计推断.在多类型复发事件下,给出了一类一般的加性比率模型,通过广义估计方程的方法给出了基准比率函数和回归系数的估计,并给出了模型检验的方法;
(5)研究了复发事件的加性比率模型的变量选择.根据加性比率模型参数估计的封闭形式,得到了一种损失函数.通过惩罚损失函数,给出了变量选择的ALASSO和SCAD方法,并证明了两种方法的oracle性质.