基于重采样和集成学习算法的肝硬化并发肝性脑病的风险预测研究

来源 :山西医科大学 | 被引量 : 0次 | 上传用户:zixialang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:肝性脑病是肝硬化极为严重的并发症,是各种肝病最常见的死亡原因,临床表现复杂多样,且预后差、治愈率低,是导致肝硬化病人生存率低的主要原因之一。因此,针对肝硬化并发肝性脑病的风险预测具有重要的临床意义。由于肝硬化并发肝性脑病的发生率较低,临床数据具有类间不平衡的特点,传统机器学习及统计模型对阳性少数类样本的识别性能较差。本文旨在构建基于重采样和异质集成学习方法的肝硬化并发肝性脑病的风险预测模型,探讨重采样技术结合异质集成算法用于类间不平衡数据的建模效果,为肝硬化患者的肝性脑病预防和早期识别提供依据。方法:收集山西医科大学第一附属医院2006年1月至2015年12月消化内科具有完整病历的肝硬化患者资料。(1)采用Logistic回归、SVM-RFE和Elastic Net方法对肝硬化并发肝性脑病的主要因素进行特征变量的初步筛选;(2)采用SMOTE、Borderline1/2-SMOTE、SVM-SMOTE、SMOTE-Tomeklinks重采样技术处理类别不平衡问题,结合随机森林、梯度提升树、极端梯度提升树3种同质集成分类算法构建肝硬化并发肝性脑病的分类模型,用准确率、精确度、召回率、F1分数和ROC曲线下面积评价同质集成分类算法的性能,并与单一分类算法的支持向量机、Logistic回归、朴素贝叶斯进行比较,选择综合性能最优的三种模型;(3)最后以此类模型为异质集成的组件学习器,Logistic回归和多层感知器MLP为元学习器,构建Stacking异质集成分类模型,建立肝硬化并发肝性脑病风险预测的最优模型。结果:1.特征变量初筛:950例肝硬化患者中68例并发肝性脑病,平均发生率为7.16%。经Logistic回归、SVM-RFE和Elastic Net方法对24个变量初筛,累计筛选出14个变量,肝肾综合征、精神萎靡、总胆红素、凝血酶原时间、感染、电解质紊乱和肝源性糖尿病7个变量为其共同特征;各方法初筛后的特征变量间相关系数均低于0.35。2.基于重采样技术的组件学习器选择:以模型性能为评价标准,SVM-RFE特征筛选方法所保留的特征变量较Logistic回归和Elastic Net方法更为合理,建模性能更好;采用重采样技术的分类模型性能整体上优于不平衡数据模型,其中,以SVM-SMOTE方法最佳;RF、GBDT和XGBoost同质集成分类算法所构建的模型性能优于单一分类算法SVM、Logistic Regression和NB所构建的模型。3.Stacking异质集成模型的肝硬化并发HE风险预测显示:在SVM-RFE特征变量筛选、SVM-SMOTE重采样技术的前提下,RF、GBDT和XGBoost为组件学习器、MLP为元学习器的Stacking异质集成模型对肝硬化并发HE风险预测性能最好,其AUC为0.956、准确率为0.879、精确度为0.841、召回率为0.932、F1分数为0.886。结论:1.肝肾综合征、电解质紊乱、精神萎靡、总胆红素、感染、凝血酶原时间和肝源性糖尿病7个变量为Logistic回归、SVM-RFE和Elastic Net三种方法筛选的肝硬化并发肝性脑病的共同特征;SVM-RFE特征筛选方法所保留的特征变量较Logistic回归和Elastic Net方法更为合理,建模性能更好。2.使用SMOTE、Borderline-SMOTE、SVM-SMOTE和SMOTE-Tomeklinks等多种重采样方法的分类模型性能优于未平衡数据模型,以SVM-SMOTE方法最佳。3.RF、GBDT和XGBoost同质集成分类算法所构建的模型性能优于单一分类算法SVM、Logistic Regression和朴素贝叶斯所构建的模型,其中,以RF的性能最好。4.在SVM-RFE特征变量筛选、SVM-SMOTE重采样技术的前提下,RF、GBDT和XGBoost为组件学习器,MLP为元学习器的Stacking异质集成模型所构建的肝硬化并发肝性脑病的风险预测模型性能最优。
其他文献
目的:1.比较射血分数保留型心力衰竭(HFpEF)合并T2DM患者与非T2DM的HFpEF的临床特点。2.比较非HFpEF的2型糖尿病(T2DM)和T2DM合并HFpEF的临床特点。方法:选取2017年12月-2020年12月于山西医科大学第二医院住院治疗的HFpEF患者274例为研究对象,按是否合并2型糖尿病将274例HFpEF患者分为非T2DM的HFpEF组145例和HFpEF合并2型糖尿病1
目的:探讨亚临床甲减与2型糖尿病患者胰岛素抵抗的关系,观察2型糖尿病合并亚临床甲减患者给予甲状腺激素替代治疗后胰岛素抵抗及胰岛功能的变化情况。方法:本研究纳入2019年02月至2020年12月于山西省人民医院内分泌科住院的2型糖尿病患者共计157名,其中甲状腺功能正常患者为对照组共纳入54名,轻度亚临床甲状腺功能减退(SCH)(4.2
目的:研究氧化低密度脂蛋白(ox-LDL)对大鼠肝星状细胞(HSC-T6)自噬的影响及机制,探讨非酒精性脂肪性肝炎的发病机理。方法:(1)体外培养HSC-T6细胞,剂量效应组用质量浓度(0、10、20、40、60μg/m L)的ox-LDL处理HSC-T6细胞24 h;时间效应组用20μg/m L的ox-LDL处理HSC-T6细胞0、3、6、12、24 h后,Western blot检测自噬相关蛋
目的:体外分离、培养BMSC植入骨质疏松性大鼠椎体内,小剂量、间断使用PTH促进BMSC向成骨细胞分化,初步研究移植BMSC治疗骨质疏松性椎体的可行性。方法:1.将42只大鼠随机分为空白对照组(SHAM,n=9)和模型组(OVX,n=33)。模型组采用切除双侧卵巢的方式来建立骨质疏松模型;对照组则切除卵巢周围相同体积大小的脂肪组织作为对照。模型建立10周后各组随机选取1只大鼠,脱颈法处死,取腰5椎
背景:类风湿关节炎是一种以侵蚀性、慢性对称性多关节炎的自身免疫病,典型病理变化是关节滑膜异常增生以及软骨和骨质的破坏,FLSs在RA发病过程中发挥核心作用,RAFLSs异常表达miRNA参与RA关节炎症、滑膜增生、组织破坏;MSC-Exos为MSCs产生的30-150 nm膜分泌体系,既保留了MSCs功能,又具备精准高效的传递方式和易于保存和调控的结构优势,MSC-Exos内含的miRNA是MSC
目的:比较2011年Kwak TI-RADS、2017年ACR TI-RADS与2020 C-TIRADS三种超声危险分层系统在超声引导下细针穿刺细胞学检查(ultrasound-guided fine needle aspiration cytology,US-FNAC)细胞学结果为BethesdaⅢ类甲状腺结节中的诊断效能,以指导临床管理与决策。方法:回顾性分析2018.01-2020.06于
目的:探讨S100A8与S100A9蛋白与幽门螺杆菌相关慢性胃炎及其进展的关系,为临床监测幽门螺杆菌相关胃炎的进展和治疗提供理论依据。方法:收集2019年1月1日至2020年8月31日就诊于山西医科大学第一医院消化科的95名患者,根据14C呼气试验结果分为H.pylori感染组和非H.pylori感染组,进一步行胃镜检查并留取胃黏膜标本行组织病理学检测和后续实验。用Western Blot法检测胃
目的目前,代谢相关性脂肪肝(MAFLD)患病率跃升到29.2%,尚无有效的治疗药物,尚无强有力的证据证明某种特定的饮食方法可以来治疗MAFLD,其一线治疗方案仍为治疗性生活方式改变。脂肪肝患者知晓饮食及运动改变的重要性,但仍然难以坚持,功能性食物成为越来越多人的选择。药食同源文化是我国传统饮食文化的瑰宝。山西苦荞是具有降脂活性的优良品种,沙棘具有广泛的药理效果,是藏医、蒙医的常用药物。苦荞、沙棘醋
目的:探讨感染性心内膜炎外科手术治疗的临床效果。方法:收集2009年6月至-2019年12月间收治43例感染性心内膜炎手术患者的临床资料。通过查阅病历收集患者的相关信息,包括一般情况、临床表现、心脏基础病史、超声心动图表现、手术方式、术后ICU情况、住院时间、术后并发症等。将资料记录、整理,并比较分析。根据相关文献报道及指南,以收治入院治疗开始至进行手术的治疗时间,根据是否完成正规药物抗感染治疗4
目的:探究高血压患者在全麻诱导期间血清Apelin-12和AngⅡ的变化,评估其血管保护作用,进而为患者的术后转归提出指导意见。方法:选取2018年9月~2019年11月在山西医科大学附属第二医院腹腔镜胆囊手术患者220例,依据《中国高血压防治指南2010》以及纳入及排除标准进行筛选,按照随机数字表法分为高血压组40人和对照组40人。记录各组患者全麻诱导前后SBP、DBP、MAP、ST-T的变化程