基于随机森林的肝硬化上消化道出血风险预测

来源 :山西医科大学 | 被引量 : 9次 | 上传用户:ximage
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:基于肝硬化患者的临床病历数据,构建肝硬化患者上消化道出血的随机森林预测模型。通过随机森林模型实现对肝硬化患者并发上消化道出血发病与否及发病概率预测,识别出将会发生上消化道出血的肝硬化患者,把握疾病发展动态。从而可以通过避免接触上消化道出血诱因,以及尽早的干预与预防性治疗等措施,降低肝硬化上消化道出血的发生率及致死率。方法:通过回顾性收集山西医科大学第一临床医院消化内科2006年1月~2015年12月期间出院的肝硬化患者病历中的基本信息、既往疾病史、并发症、入院临床表现及体征、入院血常规、血生化、相关抗原、凝血功能检查等资料。利用卡方检验及T检验筛选出与并发上消化道出血有关联的变量,并经临床专家结合临床实际剔除为上消化道出血的表现的变量。将数据集按3:1:1比例随机分成训练数据集、验证数据集和测试数据集三部分。以筛选出的自变量为输入,是否并发上消化道出血为输出,在训练数据集中分别建立logistic回归、决策树和随机森林预测模型,验证数据集用于决策树和随机森林模型模型性能提升时各不同参数设置模型的预测性能比较,最终在测试数据集中评价三种最终模型预测的准确度、灵敏度、特异度、阳性预测值、阴性预测值和AUC指标并进行比较。结果:通过筛选,最终用于建模的变量为:Child-Pugh分级、恶心、腹胀、浮肿、腹水、移动性浊音、上消化道出血病史、脾切手术史、总蛋白、白蛋白、总胆红素、碱性磷酸酶、谷氨酰转肽酶、血糖、胆固醇、尿素氮、血清钾、凝血酶原百分活动度、活化部分凝血活酶时间、癌胚抗原和CA19-9抗原,共21个。logistic回归预测模型在测试数据集中预测结果为:准确度81.50%、灵敏度60.00%、特异度89.20%、阳性预测值66.70%、阴性预测值86.10%、AUC值0.854。决策树模型通过验证数据集的验证,最佳参数设置为:采用信息熵(information)为分裂属性选择度量标准,后剪枝处理复杂度参数CP为0.026,损失矩阵(loss)设置为C(0,3,1,0)。决策树模型在测试数据集中预测结果为:准确度75.10%、灵敏度78.00%、特异度74.10%、阳性预测值52.00%、阴性预测值90.40%、AUC值0.720。随机森林模型通过验证数据集的验证,最佳参数设置为:模型包含树的棵数(ntree)为500,随机选择的特征数(mtry)为4。随机森林模型在测试数据集中预测结果为:准确度88.90%、灵敏度64.00%、特异度97.80%、阳性预测值91.40%、阴性预测值88.30%、AUC值0.909。通过比较各项指标以及ROC曲线图,随机森林模型具有最佳的肝硬化上消化道出血预测性能。结论:随机森林模型在肝硬化上消化道出血预测中性能优于决策树和传统logistic回归模型。可以利用肝硬化患者的既往疾病史、并发症、入院临床表现及体征、入院血常规、血生化、相关抗原和凝血功能检查这些简单常规检查信息,实现对肝硬化患者并发上消化道出血的是否发病及发病概率预测。可为进一步干预与预防性治疗提供依据。
其他文献
目的:研究老年性瘙痒症患者治疗中防风通圣散联合枸地氯雷他定片的应用效果.方法:研究对象为2018年1月-2019年12月入院的80例老年性瘙痒症患者,参考随机数字表法分为研究组(4
在市场经济的作用下,有限责任公司经营发展中的股权质押与转让是实现融资的重要手段,在《中华人民共和国公司法》中针对股权质押与转让已经作出了规定.本文以有限责任公司股
《选读》这门课是高中语文教学中起重要衔接作用的一门课程,起着承上启下的过渡作用,它既是对课内文言知识的巩固加深,又是对语文素养、独立阅读和写作能力的拓展延伸.因此,
思想政治理论有效融入企业管理,是企业实现科学发展的一个重要因素.处理好企业管理与思想政治工作的关系,对进一步促进企业的改革与发展,发挥企业的竞争优势而言具有重要意义
经济法体系是调整现代国家进行宏观调控和市场规制过程中发生的社会关系的法律规范的总称.我国经济法体系包括宏观调控法和市场规制法两大体系,在不同的方面通过不同的方式对
目的:探讨分析脾胃虚弱型慢性萎缩性胃炎行“温阳健脾汤”治疗的临床疗效.方法:将2019年9月~2020年5月在我院接受治疗的脾胃虚弱型慢性萎缩性胃炎患者列为观察对象,数字随机选