论文部分内容阅读
面板计数数据产生于关于复发事件或历史事件的研究中,其中试验个体只在特定离散时间点观测.该类数据来自于各种领域,包括医学研究,保险研究,可靠性和致瘤性试验中.目前,有关面板计数数据的研究引起了大量的关注.然而我们发现大多数方法都缺乏稳健性,对异常值点非常敏感.有关面板计数数据稳健估计的研究文献非常有限,因此,本文中我们主要讨论面板计数数据的稳健估计问题.主要内容如下:(1)我们提出了基于分位数回归下的面板计数数据联合脆弱模型稳健变量选择的方法.我们应用三步估计方法估计未知系数以及未知函数.第一步:观测过程的估计,即非参数方法估计基准函数以及惩罚方法估计协变量.第二步:利用带惩罚的EM算法对随访过程进行估计.第三步:对复发事件过程利用基于分位数下稳健变量选择方法进行估计.由于面板计数数据为离散变量,因此首先通过平滑技术将离散变量连续化,然后利用样条函数对基准函数进行近似,最后通过惩罚的分位数回归对感兴趣的变量进行估计.在一些常规正则条件下,建立了估计的相合性以及Oracle性质.随机模拟以及膀胱癌数据分析验证了所提方法在有限样本下的表现.(2)提出了具有信息观测时间的半参数部分线性变系数面板计数数据模型,用来描述变量之间非线性的交互效应.首先对基准函数以及变系数利用B-样条函数近似,然后对该模型利用分位数回归进行统计推断.另外,我们给出了估计量的渐近理论性质.通过数值模拟验证以及评估了所提方法在有限样本下的表现.最后,将所提出的模型应用于膀胱癌数据作为实例研究.(3)为了考虑个体内部之间的相关性,我们提出基于二次推断函数下的变时间系数面板计数数据模型分位数估计方法.所提方法可以很容易地考虑个体内部之间的相关性,并且即使在工作相关矩阵错误给定时也可以得到更有效的估计.另外提出了非参数假设检验对系数是否随时间变化进行检验.在一些正则条件下,我们给出了估计量的渐近结果.通过数值模拟验证以及评估了所提方法在有限样本下的表现及其有效性.最后,实例数据-膀胱癌数据被重新利用所提的模型以及方法进行分析.(4)考虑到观测过程可能与复发事件过程相关,我们建立了一个更一般的面板计数数据模型.带惩罚的复合分位数方法被用来对该模型进行估计.在一些常规正则条件下,建立了估计量的相合性以及Oracle性质.通过数值模拟验证以及评估了所提模型以及估计方法在有限样本下的表现.另外我们重新对膀胱癌数据进行了分析。本文的创新之处如下:一.利用基于分位数回归的稳健变量选择方法对面板计数数据联合脆弱模型进行估计,进一步丰富了面板计数数据的稳健估计方法.二.我们对具有信息观测时间的部分变系数面板计数数据模型进行分位数估计,所提方法具有很好的稳健性并且对异常值不敏感.三.我们考虑了变时间系数的面板计数数据模型中个体内部的相关性,并且通过基于二次推断函数的分位数回归方法得到有效的估计.四.提出了一个更一般的具有相依观测过程的面板计数数据模型.利用惩罚复合分位数方法得到模型的有效估计。