广义线性模型下基于因变量抽样设计的统计推断方法及其应用

来源 :武汉大学 | 被引量 : 0次 | 上传用户:fibiya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在许多大型队列研究中,关键协变量的观测往往花费昂贵.在预算有限的情况下,研究人员需要寻求一种节约成本、提高效率的抽样方法来解决这个难题.基于因变量抽样设计(outcome-dependent sampling design,以下简称“ODS抽样设计”)是一种回溯性抽样机制,其基于因变量的观测值来决定是否对个体的协变量进行观测.这种ODS抽样在获取研究对象全局信息的同时,能将资源集中在包含有最多的协变量与因变量关系信息的研究群体上.因此,这种有偏抽样方式能有效地提高研究效率、节约研究成本.广义线性模型是经典线性回归模型的直接推广.通过假定因变量服从指数族分布以及引入一个联系函数来建立因变量的条件期望与线性预测之间的关系,广义线性模型在大量研究领域得到了更为广泛的关注和应用.然而,基于广义线性模型的ODS抽样设计的研究还不多见.本文主要研究如何利用广义线性模型拟合基于经典ODS抽样和两阶段ODS抽样获得的数据,建立相应的统计推断方法,探讨估计的渐近理论.通过统计模拟研究所提出估计方法在有限样本情况下的表现.将提出的方法应用于实际数据分析,展示其在实际中的应用价值.本文结构安排如下:第一章中,介绍本文的研究背景,综述研究方向发展现状,总结前人已有工作,提出本文的主要工作以及创新之处.第二章中,在经典ODS抽样设计方法下,提出广义线性模型回归参数的一种半参数经验似然推断方法,并建立估计方法的渐近理论.第三章中,在两阶段ODS抽样设计方法下,综述广义线性模型回归参数的半参数经验似然估计以及其渐近性质.第四章中,通过统计模拟评估上述两种ODS抽样方法在有限样本情况下的表现.第五章中,将提出方法应用于分析两个实际数据—肾母细胞瘤数据和纽约空气质量数据.第六章中,对本文主要工作进行总结,并对未来研究工作进行展望.
其他文献
在我国,季节性冻土大约占我国国土面积的55%,多年冻土大约占国土面积的20%。随着交通事业的发展,我国在冻土地区修建了许多隧道。然而,这些隧道非常容易发生冻害,比如衬砌冻
在我国海洋运输业迅猛发展的同时,船用柴油机会排放对人体、环境和整个生态系统有害的物质,像NOx、SOx、HC和颗粒物等。在人们对居住环境的要求日益严格下,我国国内和国际海
自2002年隐匿性高血压这一概念被正式提出后,人们对隐匿性高血压的重视程度日益加深,相关研究也越来越多。随着家庭血压测量和动态血压监测的广泛应用,隐匿性高血压的诊断率逐年增高。此外,随着隐匿性高血压危害性相关研究的增加,越来越多证据表明隐匿性高血压主要引起心血管、肾脏等靶器官损害,并且与心脑血管风险增加相关。国内发起的“隐匿性高血压降压治疗保护靶器官临床试验(ANTI-MASK)”旨在通过为期1年
永磁同步电动机(PMSMs)凭借其损耗低、启动快、效率高和重量轻等优点被作为电动汽车(EV)的动力源,但PMSMs的驱动系统耦合性强、变量多且高度非线性,因此对于PMSMs的控制问题
人字齿轮不仅拥有传统齿轮固有的高传动效率、结构紧凑等优点,而且不产生轴向力。因此常被运用与重载以及可靠性要求较高的场合,如航空、船舶等领域。然而,由于齿轮传动的时
研究背景:结核病是由结核分枝杆菌感染引起的慢性传染病,结核病目前仍是困扰很多发展中国家的公共健康问题,根据世界卫生组织报道(WHO)2016年调查报告显示,全球有1040万人患
聚类研究是高维数据分析中的重要的环节,传统的聚类方法大多是基于距离准则来判断的.但是随着大数据时代的到来,数据形态千差万别,数据结构错综复杂,此时无法找到合适的距离
金属有机框架(Metal-organic frameworks,MOFs)由于具有大的比表面积、高的孔隙率和丰富的活性位点等特性,成为高效光催化剂的前驱体。通过直接煅烧MOFs得到的MOFs衍生的多孔碳
本文是一篇基于儿童文学作品《五纸妹历险记》(The Five Sisters)的英译汉翻译实践报告。该英文小说的原作者为新西兰著名的儿童文学作家——玛格丽特·梅喜(Margaret Mahy),
滚动轴承是冶金企业轧机的重要基础部件之一,其工作状态良好与否直接关系到设备的安全、高效的运行,决定着企业的提质增效。通常,轧机工作在高温、高压、高湿、多粉尘的环境