论文部分内容阅读
目的:坏死性小肠结肠炎(NEC)是早产儿最常见和最严重的肠道炎症性疾病。该研究通过回顾性分析早产NEC患儿发病前及发病时的危险因素,将机器学习方法应用于NEC诊断的预测,并比较传统logistic回归模型与机器学习模型的预测性能。方法:(1)本研究选择2015年1月-2021年10月在吉林大学第一医院新生儿科因出现疑似NEC症状进行腹部影像学检查的早产儿564例(其中NEC组264例,非NEC组300例),收集所有病例的发病前及发病时的临床资料,分析比较NEC组和非NEC组之间的变量,通过Logistic回归分析,筛选出与NEC诊断相关的危险因素并建立回归方程,评估其预测NEC诊断的准确性。(2)采用特征选择方法中的递归特征消除(RFE)、最大相关最小冗余(MRMR)、弹性网(EN)对全部变量进行特征选择,综合三种方法的结果筛选最终纳入变量,采用支持向量机(SVM)、多层神经网络(MLP)和极端梯度提升(XGBoost)三种机器学习分类模型建立NEC的诊断预测模型并进行性能评价,比较不同模型的受试者工作特征曲线下面积(AUC)、灵敏度、特异度、阴性预测值和阳性预测值。结果:(1)多因素Logistic回归分析显示,与NEC诊断相关的独立危险因素包括:动脉导管未闭(PDA)[比值比(OR):1.802,95%可信区间(CI):1.004-3.234,P=0.048]、发病时出现喂养残留(OR:2.544,95%CI:1.417-4.567,P=0.002)、超声下提示肠壁积气(OR:4.026,95%CI:2.122-7.639,P<0.001)、门静脉积气(OR:7.115,95%CI:3.606-14.041,P<0.001)、肠管扩张(OR:13.562,95%CI:6.378-28.838,P<0.001)、肠壁增厚(OR:3.948,95%CI:2.017-7.725,P<0.001)、肠内喂养开始时间(OR:0.227,95%CI:0.123-0.418,P<0.001)、喂养速度(OR:6.248,95%CI:3.282-11.895,P<0.001)、母乳喂养(OR:0.215,95%CI:0.112-0.415,P<0.001)、口服益生菌(OR:0.310,95%CI:0.166-0.578,P<0.001)、出生时单核细胞百分比(MO%)(OR:0.878,95%CI:0.816-0.944,P=0.001)、发病时中性粒细胞百分比(NEUT%)(OR:1.035,95%CI:1.018-1.051,P<0.001)、发病时平均红细胞体积(MCV)(OR:0.957,95%CI:0.918-0.997,P=0.037)、白细胞总数(WBC)变化(OR:0.619,95%CI:0.425-0.902,P=0.013)。(2)MRMR筛选的重要性排名前5的变量:超声下肠管扩张(0.124370)、淋巴细胞(LY)计数变化(0.118769)、门静脉积气(0.099929)、出生时MO%(0.099673)、发病时红细胞比容(HCT)(0.097583);RFE筛选的重要性排名前5的变量:肠管扩张(0.101730)、门静脉积气(0.092147)、肠壁积气(0.072376)、发病时NEUT%(0.072009)、喂养种类(0.062553);EN筛选的重要性排名前5的变量:肠管扩张(0.107048)、LY计数变化(0.090874)、门静脉积气(0.086775)、发病时NEUT%(0.084808)、出生时MO%(0.079484)。(3)综合三种特征选择方法确定的变量,采用纳入三组变量子集的交集(F-I)和并集(F-U)两种策略进行NEC预测模型的建立。基于F-I特征选择策略构建的诊断预测模型中,SVM性能评估表现最好(AUC:0.919,95%CI:0.866-0.972;准确度0.854;灵敏度0.847;特异度0.880;阳性预测值0.850;阴性预测值0.873)。基于F-U策略建立的诊断预测模型中,MLP性能评估表现最好(AUC:0.933,95%CI:0.883-0.983;准确度0.867;特异度0.873;阳性预测值0.867)。结论:(1)超声下肠管扩张、肠壁积气、门静脉积气、肠壁增厚、喂养种类、喂养速度、肠内喂养开始时间、口服益生菌、妊娠期糖尿病、胎盘异常、出生时MO%、发病时HCT、早发性败血症、迟发性败血症、PDA、肠鸣音减弱、呕吐、喂养残留、血便、出生时WBC、出生时血红蛋白、出生红细胞计数(RBC)、出生时平均红细胞血红蛋白量(MCH)、出生时MO计数、发病时NEUT%、发病时RBC、发病时MCV、HCT变化、LY计数变化、RBC变化、红细胞分布宽度变化、MCH变化是预测NEC发生的有效指标。(2)腹部影像学检查、喂养策略(肠内营养开始时间、喂养速度、喂养种类、益生菌的使用等)及血常规参数在早产儿NEC鉴别诊断中具有重要价值。(3)传统Logistic回归模型和机器学习模型在预测NEC诊断方面表现均良好且稳定,其中,SVM模型结合F-I特征选择策略的综合诊断性能最佳。基于机器学习算法构建的分类预测模型对于NEC的鉴别诊断具备一定的临床实用价值。