基于分层对照数据的Logistic回归模型在ROC问题中的理论及其应用研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:li132zhihua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Logistic回归模型在医学研究及应用中有广泛应用,尤其在病例对照数据中探究某一因素的诊断性能(Receiver Operating Characteristic,ROC)曲线时更是如此。但是在通常的诊断测试中,当研究某一因素的诊断性能时,往往会受协变量的影响,此时要充分利用协变量这一辅助信息。例如,当研究某一地区的患病因素的诊断性能时,受某些条件制约,可获得的数据十分有限,由现有数据得到的统计推断的结果往往不够准确或精确。此时,我们可以借助现有的相邻地区的这一患病因素的相关数据;或者当研究某一人群患病因素的诊断性能时,我们可以考虑该因素的不同年龄层的诊断性能等进行研究。本学位论文从有效地利用现有数据为出发点,研究基于分层对照数据下Logistic回归模型在ROC问题中的统计建模理论、方法及其应用问题,得到了如下成果。论文借鉴不分层对照数据下Logistic回归模型中的ROC曲线的研究理论和方法,讨论分层对照数据下两种Logistic回归模型中的ROC曲线问题。借助现有信息,将现有信息与试验信息进行分层处理,由于不同层间的暴露因素对疾病的影响程度未必总是一致的特征,提出不同层间相互独立,即每层间的回归系数不一致的分层对照数据下Logistic回归模型I和不同层间的暴露因素与疾病间仅存在混杂效应,即每层间的回归系数一致的Logistic回归模型II。我们分别给出了两个Logistic回归模型中的协变量调整后的ROC曲线的参数估计,非参数估计以及半参数估计的方法,并给出了协变量调整后的ROC曲线的半参数估计渐近理论及其证明;证明了在模型I中的协变量调整后的ROC曲线的半参数估计的渐近效率优于非参数估计的渐近效率等。通过数值模拟,给出了模型I和模型II中的协变量调整后的ROC曲线下的面积的半参数Bootstrap区间估计,协变量调整后的ROC曲线的三种估计的功效,得到了半参数估计优于通常的非参数估计和一般的参数估计的结论。将结论应用到实际。
其他文献
1917年俄国爆发十月革命,给救亡图存、积极探索中国出路的先进国人送来了马克思主义。在马克思主义在全国范围内开始传播的大背景下,地理位置上与俄国毗邻的新疆,马克思主义的传播情况如何?本文试就这一问题展开历史研究,特别聚焦于新民主主义革命时期马克思主义在新疆的传播开展专门探究。文章从结构上分为三大部分,引言、正文和结语。引言就选题来源和意义、研究综述、研究方法和思路以及本文的重点与难点、创新点做了相
电子皮带秤是工业生产过程中对输送带传送的散状固体物料进行连续称重的计量设备,在火电厂中经常被用于锅炉制粉系统的前端,它能够调节进入下端磨煤机煤料的瞬时流量,并且计
传统村落是我国宝贵的文化遗产,也是一种不可再生、潜在的旅游资源。其保护和发展存在多种方式,其中旅游开发是重要和常见的一种。20世纪90年代以来,一些传统村落通过旅游开发,一定程度实现了现代化转型。在其转型过程中,文化的稳定性、延续性是相对的,变迁是常态和永恒的。作为中国传统村落、中国历史文化名村、国家文物保护单位,鱼木寨依托自身的区位优势以及得天独厚的自然资源和人文资源,自20世纪90年代开始发展
相对于显热储热材料而言,相变储热材料由于其能量密度高、体积小、储放热能时温度稳定的特点而备受关注。近年来以有机相变储能材料为主的各种相变材料被广泛应用于建筑节能保温、工业节能、电力调峰平谷等多个领域。本研究旨在尝试使用通过原位添加无机纳米颗粒以及小分子有机物添加剂来对低温有机相变材料进行改性和性能调控,同时尝试建立相变材料导热性能的快速评价方法,并在此基础上进一步研究低温有机复合相变储能材料并探究
目前随着人工智能与移动互联网应用技术的发展,以及结合幼儿园对于儿童成长信息管理的需求。因此结合AI(Artificial Intelligence)大数据的儿童成长信息化系统的研究,不仅能够实现儿童成长数据的自动采集,大幅提高效率。还能基于采集的数据在云端进行大数据分析,让家长对孩子的健康成长产生更直观的感受和有针对性的帮助。该研究成果还可扩展应用在幼教、社区医院、特殊教育学校等机构场所中,有助于
伊犁芦草沟镇地处霍城县东北方向,其方言具有自身的复杂性和独特性。本文在马克思主义理论指导下,以伊犁芦草沟话为研究对象,综合运用汉语方言学和社会语言学的研究理论与方法,通过田野调查法和问卷调查法收集语料,并利用SPSS19.0进行数据分析,探究伊犁芦草沟话语音变异的特点和机制。本文共6个部分,说明了研究目的、意义,总结国内外语言变异研究概况并阐释了本文的理论依据、研究方法等内容;介绍伊犁芦草沟镇相关
目的:肺癌的发病率和死亡率都位居全球最高,我国拥有世界三分之一的肺癌患者。目前肺癌的主要治疗方法为外科手术、放化疗和靶向治疗,但预后并不理想,五年存活率仍然很低。因此,深入了解肺癌发生发展的机制显得尤为重要。细胞叠套结构(Cell-in-cell structure,CICs)是近年发现的一种新的非凋亡的细胞死亡方式,肿瘤组织的细胞叠套结构中,内化细胞的命运主要有分裂、逃逸、死亡和长时间滞留,其中
病理语音是发声系统异常所产生的语音,可由多种疾病引起,其中构音障碍是由于神经病变导致发音器官出现肌肉功能减弱或不协调的一种疾病,它会导致发音困难和吐字不清。随着人们对语音信号的产生原理和传输过程进一步解析,针对病理语音的分析识别能够对患者病情的诊断和治疗起到明显作用,特征的分析进一步加深了人们对构音障碍和正常语音间区别的认识,因此对于病理语音特征分析的关键技术研究具有极大的社会意义。目前对各种疾病
随着经济全球化进程的加快和燃气轮机市场的竞争加剧,燃气轮机制造厂家不仅面临着来自质量、成本、技术、服务等的挑战,更让其自身承受着经营理念和运营模式转变、组织结构和
农村公路是公路交通运输系统深入农村地区的毛细血管,连接着农村、城市、乡镇集贸市场、产业园区、旅游景区、矿产资源开发地等节点,对推进新农村建设和新型城镇化建设具有重大的作用。而目前,我国农村公路发展相对滞后,在路网布局优化的随意性和盲目性尤为突出,制约着农村地区经济社会的发展。因此,本文针对路网布局的不合理,提出农村公路路网布局优化的方法。本文主要研究内容如下:首先结合农村公路的类型和功能,深入分析