论文部分内容阅读
目的探索了解影响肝硬化患者出院1个月内再入院的影响因素,并构建其风险预测模型,为制定个性化出院护理措施,完善出院准备提供参考依据,以期延长患者再入院周期。方法回顾性调查2015年1月~2020年10月镇江市某三级医院肝病科住院的成人肝硬化患者共506例,采用一般资料调查表对患者资料进行收集,将收集的资料分为建模组和验证组,利用建模组数据样本分别构建Logistic回归模型和决策树模型。(1)基于Logistic回归法构建预测模型。数据集按照7:3随机分成建模组和验证组,将初步筛选的再入院影响因素进行单因素分析,结果具有统计学差异的变量(P<0.05)再进行多因素分析,得出再入院独立预测因素,并利用各变量回归系数构建风险预测模型,通过拟合优度检验(Hosmer-Lemeshow,H-L)和受试者工作特征曲线下面积(Area Under the Curve,AUC)评估模型预测效果。(2)基于机器学习法利用R语言构建决策树模型。通过编写R语言代码,将506例样本按照3:1随机分成训练集和测试集。以“是否发生再入院”作为因变量,将所有可能影响患者再入院的因素作为自变量直接代入,生长方法为分类回归树(Classification Regression Tree,CART),通过参数复杂度对树的生长进行剪枝控制,最终建立决策树模型,通过AUC评估模型预测性能。对比两种模型预测效果,选择最佳模型。结果1.肝硬化患者出院1个月内再入院的现况及原因本研究共纳入506例肝硬化患者,其中139例(27.5%)在出院1个月内再次入院,引起肝硬化患者1个月内再入院的主要原因为出现皮肤、黏膜黄染等黄疸症状(38例,27.3%)、腹水(31例,22.3%)、自发性细菌性腹膜炎(Spontaneous Bacterial Peritonitis,SBP)(19例,13.7%)、食管胃底静脉曲张破裂出血(Esophagogastric Variceal Bleeding,EGVB)(24例,17.3%)和肝性脑病(Hepatic Encephalopathy,HE)(21例,15.1%)。2.Logistic风险回归模型的构建与验证本研究将建模组354例(再入院94例,26.6%)患者的资料进行单因素分析,结果显示缴费类型、食管胃底静脉曲张(Esophagealgastric Varices,EGV)、腹水、HE、电解质紊乱、经颈静脉肝内门腔静脉分流术(Transjugular Intrahepatic Portosystemic Shunt,TIPS)治疗、血清Na、白蛋白、国际标准化比值(International Normalized Ratio,INR)、纤维蛋白原和终末期肝病模型(Model for End-stage Liver Disease,MELD)评分这11个变量有统计学差异(P<0.05),是再入院的影响因素。以出院1个月内是否再入院为因变量,将单因素分析中有意义的变量作为自变量,进行Logistic多因素回归分析,结果显示缴费类型(OR=0.267,95%CI为0.111~0.644,P=0.003)、EGV(OR=3.361,95%CI为1.832~6.165,P<0.001)、腹水(OR=3.571,95%CI为1.915~6.658,P<0.001)、HE(OR=11.087,95%CI为5.109~24.063,P<0.001)、血清钠水平异常(偏低)(OR=4.653,95%CI为2.486~8.706,P<0.001)、TIPS治疗(OR=27.013,95%CI为4.009~182.014,P=0.001)是引起肝硬化患者1个月内发生再入院的独立影响因素。根据多因素分析中各变量的偏回归系数构建预测模型方程:Logit(P)=1.212×食管胃底静脉曲张+1.273×腹水+2.406×肝性脑病+血清Na[1.537×偏低(0,1)+0.002×偏高(0,1)]+3.296×TIPS治疗-1.320×缴费类型-2.979。以公式计算所得截断值为检验变量,是否发生再入院为状态变量,绘制截断值的受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC),计算约登指数最大值0.472,敏感度为73.4%,特异度为73.8%,最佳截断值0.230,AUC为0.803,H-L检验结果χ~2=3.149,P=0.871。将验证组152例(再入院45例,29.6%)资料代入模型公式计算相应的截断值,若截断值≥0.230,认为是出院1个月内再入院高危人群。绘制验证组截断值的ROC曲线,结果显示AUC为0.764,95%可信区间为0.685-0.843,敏感度为75.6%,特异度为72.9%,说明回归模型整体预测性能较好。3.决策树模型的构建与验证通过R语言构建决策树,训练集387例,测试集119例,最终生成的节点分别为HE、血清Na、EGV、年龄和意外事件评分。利用训练集数据所得截断值,绘制ROC曲线,得出曲线下面积AUC=0.757,约登指数最大值为0.450。将测试集数据代入模型,得出AUC为0.622。结论1.通过比较两种模型ROC曲线下面积,发现基于Logistic逻辑回归构建的模型预测效果更好。2.在患者住院期间使用Logistic回归模型作为筛查工具对患者再入院情况进行早期预测,有助于改进出院护理措施,为制定出院计划和延续性护理提供依据。