【摘 要】
:
目的:将自然梯度提升算法引入到传统的集成回归树模型框架中,构建出可用于对连续型结局变量进行概率预测的NGBoost模型。通过不同的模拟数据、公共数据库和真实数据集,验证该模型的预判效果,进行应用探讨;将该模型应用于异质性的冠心病患者群体冠脉堵塞程度的个性化评估中,并为每位患者得出结果空间的全概率分布曲线,为临床决策者制定个性化的治疗方案提供信心。方法:本文数据来源包括三部分,1.通过SAS的数据模
论文部分内容阅读
目的:将自然梯度提升算法引入到传统的集成回归树模型框架中,构建出可用于对连续型结局变量进行概率预测的NGBoost模型。通过不同的模拟数据、公共数据库和真实数据集,验证该模型的预判效果,进行应用探讨;将该模型应用于异质性的冠心病患者群体冠脉堵塞程度的个性化评估中,并为每位患者得出结果空间的全概率分布曲线,为临床决策者制定个性化的治疗方案提供信心。方法:本文数据来源包括三部分,1.通过SAS的数据模拟程序,模拟产生三种不同样本量,不同分布类型的数据集;2.公共数据库;3.山大一院、山西省心血管病医院2017年5月至2019年12月31日期间,明确诊断为冠心病并接受了有创性冠状动脉造影检查的患者数据。为去除因调参不均导致的模型预测效果不可比,本文在不调参的情况下比较分析随机森林、极限梯度提升机、轻梯度提升机和自然梯度提升机在模拟数据集、公共数据库的拟合效果;为构建适合临床应用的,具有良好预测能力的模型,在调参的情况下,对慢性心衰患者冠脉狭窄程度进行以上4种模型的建模和对比分析,构建预测模型APP,并随意挑选测试集的两名患者,绘制了患者个性化的概率分布图。结果:样本量为1000的模拟数据结果显示:NGBoost模型决定系数R2(0.637)>RF(0.598)>Light GBM(0.555)>XGBoost(0.531);样本量为5000的模拟数据结果:NG Boost(0.624)>Light GBM(0.604)>RF(0.592)>XGBoost(0.581);样本量为10000的模拟数据结果:NGBoost(0.633)>Light GBM(0.621)>RF(0.603)>XGBoost(0.593)。波士顿房价数据集结果显示:NGBoost(0.868)>XGBoost(0.842)>Light GBM(0.841)>RF(0.839)。真实冠心病患者数据集结果显示:NGBoost(0.714)>XGBoost(0.705)>RF(0.692)>Light GBM(0.674)。此外NGBoost模型的估计误差在大多数情况下均比较小。在所有的模拟数据集、公共数据库与真实数据中,NGBoost模型性能始终比较稳定,预测效果好,还可以每位患者都绘制结果空间的概率预判分布曲线。结论:NGBoost模型在集成回归树模型的框架下,引入自然梯度提升算法,以求能够得出事件结果空间的全概率预判分布,为临床治疗决策提供信心。通过与随机回归森林、极限梯度提升机、轻梯度提升机,在模拟实验、公共数据库和真实数据中进行对比分析和应用探讨后发现,该方法预测误差小、性能稳定,适用于不同样本量、不同分布情况的结构化数据,操作简便且可以得出具有个性化特征的概率分布曲线,具有临床应用推广价值。
其他文献
研究背景:高血压(hypertension)是以体循环动脉血压持续升高(≥140/90 mm Hg)为主要表现的一类临床综合征。高血压所并发的左心室肥厚是最为常见的高血压靶器官损害之一。高血压诱发的左心室肥厚可使心血管疾病的发病及死亡风险升高2倍以上,其已成为临床预测心血管疾病总死亡率的强预测因子。因此,逆转高血压所导致的左心室肥厚是降低临床心血管事件发生风险,并提高患者生存率的最有效途径。压力负
研究背景:心血管疾病的患病率与死亡率常年居高不下。目前人们对急性缺血性心脏病患者的救治主要采用缺血区域再灌注的方式,这是提高心肌梗死救治成功率的重要举措。但是,大量研究发现单纯再灌注疗法可加重已有的缺血性心肌损伤,甚至威胁患者生命,即心肌缺血/再灌注损伤(Myocardial ischemia/reperfusion injury,MI/RI)。MI/RI的发生机制复杂,研究认为过量氧自由基生成、
目的:探索中国城乡地区烹饪用燃料和高血压患病率之间的关联。方法:本研究依托于前瞻性城乡流行病学研究(PURE研究)中国地区(PURE-China研究)。于2005年5月至2009年12月期间,在12个省级行政区的城乡地区招募年龄在35~70岁之间的参与者,采用基线问卷和体格检查收集的数据。烹饪燃料来源分为固体燃料(煤、木材、农作物、动物粪便和灌木)和清洁燃料(电、天然气或沼气)。研究结局指标为高血
目的:探讨莫西沙星单药治疗无铜绿假单胞菌感染危险因素的慢性阻塞性肺疾病急性加重期(acute exacerbation of chronic obstructive pulmonary disease,AECOPD)患者的临床应用价值,评价其疗效和安全性。方法:采用随机、对照的研究方法,选取2018年12月至2020年1月于山西医科大学附属汾阳医院呼吸与危重症医学科及老年医学科住院的慢性阻塞性肺疾
目的:观察大鼠骨髓间充质干细胞来源的微颗粒(MSC-MPs)对AngⅡ诱导的H9c2心肌细胞肥大的影响并进一步探讨其作用机制。方法:颈椎脱臼法处死SD大鼠,取其胫骨和股骨,用培养基冲净骨髓腔以提取骨髓间充质干细胞(Bone marrow mesenchymal stem cells,BMSC),采用全骨髓贴壁法分离骨髓间充质干细胞。通过显微镜观察细胞形态变化并绘制生存曲线,使用流式细胞仪鉴定其表面
针对微生物发酵过程中普遍存在的时变性、非线性等问题,基于最小二乘回归算法和改进即时学习(JITL)策略设计出一种基质给进速率控制器。首先,通过发酵仪器采集数据形成历史数据库,再使用加权模糊C均值聚类(WFCM)算法对数据进行分类,使查询值到来时能快速建立基于JITL-LS-SVM的海洋碱性蛋白酶菌体浓度局部预测模型。同时,为了避免预测控制中求解非线性问题,采用泰勒线性化方法,并用广义预测(GPC)
目的:探讨血清γ-氨基丁酸(GABA)、去甲肾上腺素(NE)、内皮素-1(ET-1)及血管内皮生长因子(VEGF)在COPD合并PH(COPD-PH)患者中的诊断价值。方法:选取2019年12月-2020年12月山西白求恩医院呼吸与危重症医学科收治的COPD患者111例,根据经胸超声心动图(TTE)估测的肺动脉收缩压(PASP)结果将患者分为COPD组(PASP≤50mm Hg)和COPD-PH组
獐(Hydropotes inermis)是东亚特有种,其自然分布范围仅限于中国与朝鲜半岛,过度的人为干扰造成獐种群数量的锐减和分布空间的破碎化,形成孤立的岛屿化分布。为了解獐在岛屿化城市森林公园中的生存状况,我们利用红外相机技术在南京老山森林公园及周边对秋冬季獐进行监测,分析了其活动节律和生境选择偏好。2020年10月至2021年3月期间,共设置了35个相机位点,期间共拍摄獐的有效照片233张,
心功能不全作为各种心血管疾病发展的终末阶段,已成为严重的公共健康问题。研究表明,心肌细胞死亡是心功能不全进程中的重要因素,即使少量的心肌细胞死亡都会引起心脏电活动或机械活动紊乱,导致心功能障碍。然而,目前诱导心肌细胞死亡的原因和机制还需进一步阐明。β1肾上腺素受体(β1-adrenergic receptor,β1-AR)过度激活可引起心肌细胞死亡。研究表明,超过50%的心功能不全患者血清中可检测
背景:腹主动脉瘤(abdominal aortic aneurysm,AAA)是一种以主动脉管壁病理性扩张为特点的致命性心血管疾病。当代腹主动脉瘤发病率呈上升趋势,瘤体一旦破裂病死率高达90%。目前,腹主动脉瘤治疗方式以外科手术为主,对于直径小于55mm、瘤体扩张缓慢、不能耐受手术的患者,尚且缺乏有效干预措施。因此,寻找针对其发病机制的有效药物十分重要。研究表明炎症反应在腹主动脉瘤发病过程中发挥重