论文部分内容阅读
在用数据做出决策或者科学分析时,需要考虑数据是否由于不完整而无法代表总体.而现实数据总是不完整的,可能导致用作预测和分析的模型无法识别或者给推断带来偏差.本文目的为发展统计方法处理多元数据不完整性给分析带来的偏差和效率损失问题.本文工作主要包括三部分:
1.我们提出了一个半参数copula模型的K步估计量.当初始点是相合估计但是其收敛速度未知时,我们证实了其可被提升为一个秩依赖有效性估计.如果初始点是秩依赖的且有收敛速度n-α,其中0<α≤1/2,我们证实只需非常小的迭代步数K就可以保证K步估计渐近方差是有效的.我们用一个Volterra-Fredholm积分微分方程理论来解K步估计的数值解.几个模拟显示我们提出的方法表现非常好.
2.我们考虑多元生存数据的分而治之估计.我们提出一个能处理高维协变量的Kenall’stau估计方法以及分而治之方法.并应用到几类常用的copula参数分而治之估计当中去.模拟显示我们提出的方法与不考虑协变量信息的估计量相比方差和偏差均有很大改善.所提出的方法应用于BusseltonPopulationHealthSurveys数据以研究心血管疾病下家族成员生存时间之间的相关性.
3.我们考虑了多元生存分析数据在边际分布建模下边际风险函数的分而治之估计,我们分别考虑了边际风险函数欧式参数,基线风险函数在单调约束下的纠偏分而治之估计和无约束下的分而治之估计.基于这些边际信息的估计,我们提出了copula参数K步估计的分布式版本.模拟结果显示提出的方法在计算时间或者均方误差上有所改善.所提出的方法应用于BusseltonPopulationHealthSurveys数据以研究心血管疾病下家族成员的风险函数.
4.通过copula函数,我们提出了一个带缺失多元数据的半参数可识别性条件,并给出边际条件分布,条件密度和联合条件分布的估计方法和收敛速度.对于观测值为分类变量情形,我们给出此时数据无法识别模型的例子,并在所有信息的基础上提出了一个潜变量联合分布识别区间以及置信区间.对于混合变量情形,我们给出数据可以半参数识别copula模型的例子并给出估计方法.模拟显示在缺失数据下我们所提估计量为相合估计,在分类变量和混合变量观测值下我们所提置信区间表现良好.
1.我们提出了一个半参数copula模型的K步估计量.当初始点是相合估计但是其收敛速度未知时,我们证实了其可被提升为一个秩依赖有效性估计.如果初始点是秩依赖的且有收敛速度n-α,其中0<α≤1/2,我们证实只需非常小的迭代步数K就可以保证K步估计渐近方差是有效的.我们用一个Volterra-Fredholm积分微分方程理论来解K步估计的数值解.几个模拟显示我们提出的方法表现非常好.
2.我们考虑多元生存数据的分而治之估计.我们提出一个能处理高维协变量的Kenall’stau估计方法以及分而治之方法.并应用到几类常用的copula参数分而治之估计当中去.模拟显示我们提出的方法与不考虑协变量信息的估计量相比方差和偏差均有很大改善.所提出的方法应用于BusseltonPopulationHealthSurveys数据以研究心血管疾病下家族成员生存时间之间的相关性.
3.我们考虑了多元生存分析数据在边际分布建模下边际风险函数的分而治之估计,我们分别考虑了边际风险函数欧式参数,基线风险函数在单调约束下的纠偏分而治之估计和无约束下的分而治之估计.基于这些边际信息的估计,我们提出了copula参数K步估计的分布式版本.模拟结果显示提出的方法在计算时间或者均方误差上有所改善.所提出的方法应用于BusseltonPopulationHealthSurveys数据以研究心血管疾病下家族成员的风险函数.
4.通过copula函数,我们提出了一个带缺失多元数据的半参数可识别性条件,并给出边际条件分布,条件密度和联合条件分布的估计方法和收敛速度.对于观测值为分类变量情形,我们给出此时数据无法识别模型的例子,并在所有信息的基础上提出了一个潜变量联合分布识别区间以及置信区间.对于混合变量情形,我们给出数据可以半参数识别copula模型的例子并给出估计方法.模拟显示在缺失数据下我们所提估计量为相合估计,在分类变量和混合变量观测值下我们所提置信区间表现良好.