Logistic回归模型、神经网络模型和决策树模型在肺癌术后心肺并发症预测中的比较

被引量 : 0次 | 上传用户:lxz119110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的1.了解肺癌术后心肺并发症的分布状况,探讨肺癌术后心肺并发症的主要危险因索;2.建立肺癌术后心肺并发症术后预测数学模型并比较不同模型的准确性,有助于临床病人的治疗及康复,提高病人生存率。方法1.收集安徽省某三甲医院2009~2012年间的肺癌手术病人资料,研究变量包括年龄、性别、手术方法、高血压、糖尿病、冠状动脉心脏疾病等总共15个。将收集的病例数据用EPidata3.1软件进行建立数据库和数据录入;2.我们应用SPSS软件分别使用Logistic回归、 BP神经网络模型、经Logistic回归筛选变量后的BP神经网络模型和决策树模型4种办法建立预测模型,回代数据计算ROC曲线下面积,初步比较三种模型的预测精度;3.使用随机抽样的方法将数据分为训练集和预测集,通过调整预测集的比例,评价不同模型的泛化能力稳定性及预测精度。其中,ROC曲线下面积比较使用Medcalc软件。结果1.348例肺癌患者,术后心肺并发症发生率为22.7%。并发症包括肺部感染34例(43.0%)、呼吸功能衰竭1例(1.26%)、气胸7例(8.86%)、胸腔积液13例(16.4%)、肺不张6例(7.59%)、心力衰竭2例(2.53%)、心律失常12例(15.19%)、肺栓塞1例(1.26%)、支气管胸膜瘘1例(1.26%)、胸腔出血2例(2.53%)。2.多因素Logistic回归分析显示,在研究的15个变量中,年龄(P=0.042,OR=1.898)、手术方式(P=0.022,OR=2.323)、高血压(P=0.004,OR=2.410)、白蛋白(P=0.000,OR=3.264)、一秒用力呼气容积/用力肺活量(Forced expiratory volume in one second/Forced vitalcapacity, FEV1%)(P=0.003,OR=3.944)和冠心病(P=0.014,OR=2.346)与肺癌术后心肺并发症发生的关联有统计学意义,Logistic预测模型为P=1/(1+e(2.792-0.879×高血压-0.843×手术方法-0.641×年龄-1.183×白蛋白-1.372×FEV%-0.853×冠心病))。训练样本的预测准确率为86.2%,ROC曲线下面积为0.736(95%CI:0.687-0.782)。3.一个隐藏层的BP神经网络ROC曲线下面积好于2个隐藏层的网络。BP神经网络模型预测变量重要性前五位是FEV1%(100.0%),白蛋白(63.5%),手术方法(52.2%),年龄(49.3%),高血压(42.8%)。模型的预测准确率为89.6%,ROC曲线下面积为0.825(95%CI:0.781-0.863)。4.经Logistic筛选变量后的BP神经网络预测变量重要性排序依次为FEV1%(100%)、年龄(82.8%)、白蛋白(81.2%)、高血压(80.3%)、冠心病(52.8%)。模型的预测准确率为91.1%,ROC曲线下面积为0.840(95%CI:0.797-0.877)。5.决策树模型训练样本预测准确度为90.5%,ROC曲线下面积为0.831(95%CI:0.792-0.873)。6.10%-40%4种不同预测数据集比例情况下,四种模型的ROC曲线下面积值变化不大,稳定性较好。四种比例情况下,BP神经网络模型,经Logistic筛选变量后的BP神经网络和决策树模型ROC曲线下面积与Logistic回归模型的ROC曲线下面积均有统计学差别。表明BP神经网络和决策树模型有更好的泛化能力。结论肺癌术后心肺并发症发生率较高,与年龄、手术方式、高血压史、白蛋白、FEV1%、冠心病因素有关。BP神经网络模型与决策树模型在预测肺癌术后心肺并发症性能上优于传统的Logistic回归模型。而Logistic回归模型对变量的解释能力强于BP神经网络模型与决策树模型。因此,实际使用时,可相互配合。
其他文献
英语长难句的翻译一直是英汉翻译的重点和难点,本文以笔者的翻译实践为例,进一步探讨了长难句的翻译方法。翻译作品的原文是保罗·斯塔洛宾(Paul Starobin)所著Five Roads to
线性摩擦焊机液压伺服振动系统通常采用双闭环控制,在使用传统模拟放大器负反馈控制方法调节系统内外环时,参数调节繁琐难度大,控制效果并不理想。在系统内外环的前向通道上
随着电子技术的飞速发展,对高频电流的计量校准需求日益增加。航空航天电子设备、军工产品中的运载工具、移动军事装备、航海装置等的电源系统均对重量和体积有着严格的要求。
胃癌是全世界最常见的、致死率极高的恶性肿瘤之一。随着医学的不断进步,胃癌的诊断和治疗手段已经取得了巨大的发展,但是,我国早期胃癌的检出率很低,一般为10%左右。进展期
2013年1月22日,菲律宾将南海岛屿主权争端诉诸国际海洋法法庭,提请《联合国海洋法公约》附件七项下的强制仲裁程序,使南海问题更加复杂化、国际化。公约附件七项下的强制仲裁
<正> 根据近几年北京城、郊区测点资料对比分析发现,北京城区存在“三岛”现象。分析表明,干、湿岛现象并非由于降水差异而形成。夏季城区降水多于郊区,而冬季城、郊区降水量
时间延时积分(TDI)型CMOS图像传感器是一种特殊的线阵图像传感器,在高速扫描状态下可获得比传统线阵图像传感器更高的信噪比和灵敏度,在空间成像、医学成像和工业监测等领域
"Floodarea"为德国Geomer公司开发的水动力淹没模型,该模型以GIS栅格数据为基础并根据曼宁公式建立二维水动力动态演进。上清溪流域为福建山区无水文资料的典型小流域,选其作
背景:股骨头缺血性坏死(Avascular Necrosis of the Femoral Head,ANFH)是一个不间断的病理过程,其导致股骨头塌陷、变形,最终导致关节疼痛及功能障碍。根据病因大致分为创伤性和
<正>教学内容:选自北师大版语文教材六年级下册第6单元。教材分析:本单元的主题是英雄,教材选编了5篇课文通过不同的角度展现了英雄的事迹。本篇文章是第二篇课