论文部分内容阅读
在临床研究和生物医学中,生存数据常常具有族群特性,并且在整个研究结束时往往有个体被治愈,本文就具有这样特性的生存数据进行研究分析.用逻辑回归拟合治愈率,用比例风险模型拟合未治愈病人死亡时间或者复发时间等的边际生存函数,本文采用这两个模型的混合模型即半参数边际混合治愈模型对观察到的时间建模.考虑到个体是否被治愈是不可被观察到的,有学者基于似然函数运用EM(Expectation-Maximization)算法给出参数估计值.为了兼顾治愈率与生存数据之间的相关性,考虑在参数估计方程中加入表示相关性的数据结构,此即为ES(Expectation-Solution)算法.本文提出参数的广义估计方程,并运用无参数极大似然法估计基准风险函数,另外证明在一定条件下,本文所得参数估计的渐近性质.在试验部分比较了已有方法与本文方法的有限样本性质.数据生成时,分别考虑强相关,中等相关,不相关三种程度的相关性水平,以及族内个体数量多,中等及较少的情况.对每个数据集,采用不同的方法分别进行参数估计,并展示在相应表中.结果显示当族内个体比较多并且是否被治愈与死亡个体的死亡时间均具有较强的相关性时,本文所提方法更加高效.即使族内个体之间的这种相关性较弱或者没有相关性,本文方法与已有方法也是具有可比性的.为了更加直观地比较不同方法的效果,本文还计算了不同方法间的相对效率.从相对效率的结果可以看到,当生存数据族间相关性较强时,本文方法参数均方误差与已有方法参数均方误差的比值低至35.4%,这更直观地说明本文所提方法比已有方法模型估计效率高.在文章的最后分别对骨髓移植数据和扁桃体癌数据进行分析,进一步说明三种方法的区别.