复杂数据的半参数统计分析

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:a351200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
纵向数据、复发事件数据和生存数据是纵向研究中三类典型的复杂数据,分析这些复杂数据,建立合理的统计模型并进行统计推断,进而达到解释和预测的目的,能够给我们提供很多有用的信息。因此,研究这些复杂数据不仅具有重要的理论意义,也具有广泛的应用前景。  关于纵向数据的分析,在第二章关于带信息观测和信息删失的纵向数据提出了一种联合建模的分析方法,对纵向过程采用半参数线性回归模型,对观测过程和删失时间采用加速时间模型,并且对联合分布的形式和相依结构不做任何假定。在第三章通过引入潜变量对带信息终止事件的依赖于复发事件的标记数据提出了一个可加可乘均值模型。在这两章中,都通过广义估计方程的方法建立了估计方程,并且建立了所得估计的渐近性质。此外,还提出了一些数值方法用于模型检验。通过模拟研究验证了所提出估计的有限样本性质并将我们的方法应用到弗吉尼亚大学健康系统治疗的慢性心脏衰竭疾病病人的医疗费用数据作为例证。  关于复发事件数据的分析,在第四章我们提出了关于复发间隔时间的一类部分线性转移模型,该模型加入了非线性效应的协变量,从而扩展了线性转移模型,同时该模型包含部分线性比例风险模型和部分线性比例优势模型作为特例。提出了全局和局部的估计方程用来估计参数和非参数协变量效应,并且建立了所得估计的渐近性质。通过模拟研究评估了所提出估计的有限样本性质,并将我们的方法应用于一组膀胱肿瘤数据。  关于生存数据的分析,在第五章研究了带删失生存数据的平均剩余寿命模型的变量选择问题,提出了通过惩罚估计函数的方法同时进行变量选择和回归系数的估计,并证明了通过选择合适的惩罚函数和调谐参数,我们的估计不仅是√n-相合,而且具有Oracle性质。基于局部二次逼近以及BIC-型选择准则,我们提出了一种算法来实现我们所提出的方法。模拟研究表明所提出的方法在变量选择和方差估计方面都表现良好,并将我们的方法用于梅奥诊所的原发性胆汁性肝硬化数据作为例证。
其他文献
该文较为系统地回顾了近几十年来二维数值网格生成技术的发展.提出了一种新的带有控制函数的二维网格生成方法.这种方法具有直观,灵活的特点.对比了这种方法与传统的解椭圆型
学位
学位
学位
我是淄博实验中学高三数学组老师,我在2014年4月份参加的山东省数学优质课比赛,获得了说课组一等奖.就我的经历谈一下我对说课的一点浅薄的认识.参加优质课比赛的流程是由学
期刊
学位
学位
《桥》中,老汉是父亲,更是村党支部书记。面对滔滔山洪,人们惊慌失措,而老汉却站成了一座山。他早已将生死置之度外,指挥群众依次走上木桥,这是令人感动的人性美。当他发出“
代数数论是近代数论的两个重要分支之一,它是用代数为工具来研究数论,这使数论的研究有了突破性的发展。代数数论的主要研究对象是代数数域,而代数数域的整基及其类数和类群的研