论文部分内容阅读
目的1.了解肺癌术后心肺并发症的分布状况,探讨肺癌术后心肺并发症的主要危险因索;2.建立肺癌术后心肺并发症术后预测数学模型并比较不同模型的准确性,有助于临床病人的治疗及康复,提高病人生存率。方法1.收集安徽省某三甲医院2009~2012年间的肺癌手术病人资料,研究变量包括年龄、性别、手术方法、高血压、糖尿病、冠状动脉心脏疾病等总共15个。将收集的病例数据用EPidata3.1软件进行建立数据库和数据录入;2.我们应用SPSS软件分别使用Logistic回归、 BP神经网络模型、经Logistic回归筛选变量后的BP神经网络模型和决策树模型4种办法建立预测模型,回代数据计算ROC曲线下面积,初步比较三种模型的预测精度;3.使用随机抽样的方法将数据分为训练集和预测集,通过调整预测集的比例,评价不同模型的泛化能力稳定性及预测精度。其中,ROC曲线下面积比较使用Medcalc软件。结果1.348例肺癌患者,术后心肺并发症发生率为22.7%。并发症包括肺部感染34例(43.0%)、呼吸功能衰竭1例(1.26%)、气胸7例(8.86%)、胸腔积液13例(16.4%)、肺不张6例(7.59%)、心力衰竭2例(2.53%)、心律失常12例(15.19%)、肺栓塞1例(1.26%)、支气管胸膜瘘1例(1.26%)、胸腔出血2例(2.53%)。2.多因素Logistic回归分析显示,在研究的15个变量中,年龄(P=0.042,OR=1.898)、手术方式(P=0.022,OR=2.323)、高血压(P=0.004,OR=2.410)、白蛋白(P=0.000,OR=3.264)、一秒用力呼气容积/用力肺活量(Forced expiratory volume in one second/Forced vitalcapacity, FEV1%)(P=0.003,OR=3.944)和冠心病(P=0.014,OR=2.346)与肺癌术后心肺并发症发生的关联有统计学意义,Logistic预测模型为P=1/(1+e(2.792-0.879×高血压-0.843×手术方法-0.641×年龄-1.183×白蛋白-1.372×FEV%-0.853×冠心病))。训练样本的预测准确率为86.2%,ROC曲线下面积为0.736(95%CI:0.687-0.782)。3.一个隐藏层的BP神经网络ROC曲线下面积好于2个隐藏层的网络。BP神经网络模型预测变量重要性前五位是FEV1%(100.0%),白蛋白(63.5%),手术方法(52.2%),年龄(49.3%),高血压(42.8%)。模型的预测准确率为89.6%,ROC曲线下面积为0.825(95%CI:0.781-0.863)。4.经Logistic筛选变量后的BP神经网络预测变量重要性排序依次为FEV1%(100%)、年龄(82.8%)、白蛋白(81.2%)、高血压(80.3%)、冠心病(52.8%)。模型的预测准确率为91.1%,ROC曲线下面积为0.840(95%CI:0.797-0.877)。5.决策树模型训练样本预测准确度为90.5%,ROC曲线下面积为0.831(95%CI:0.792-0.873)。6.10%-40%4种不同预测数据集比例情况下,四种模型的ROC曲线下面积值变化不大,稳定性较好。四种比例情况下,BP神经网络模型,经Logistic筛选变量后的BP神经网络和决策树模型ROC曲线下面积与Logistic回归模型的ROC曲线下面积均有统计学差别。表明BP神经网络和决策树模型有更好的泛化能力。结论肺癌术后心肺并发症发生率较高,与年龄、手术方式、高血压史、白蛋白、FEV1%、冠心病因素有关。BP神经网络模型与决策树模型在预测肺癌术后心肺并发症性能上优于传统的Logistic回归模型。而Logistic回归模型对变量的解释能力强于BP神经网络模型与决策树模型。因此,实际使用时,可相互配合。