基于概率校准和集成方法的弥漫大B细胞淋巴瘤患者死亡风险预测研究

来源 :山西医科大学 | 被引量 : 0次 | 上传用户:mistbaby
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:弥漫性大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)是B细胞非霍奇金淋巴瘤中一种常见的侵袭性恶性肿瘤。虽然利妥昔单抗联合标准化学治疗的临床方案进一步提高了患者的总体生存率,但仍有30%-50%的病人出现耐药或在病情缓解后复发并最终死亡。此外,受疾病分期、肿瘤分型、治疗方案等因素的影响,病人的预后存在明显差异。现有研究大多关注的是DLBCL群体水平,如患者预后因素的分析、总体生存率的估计、药物评价等。基于病人的临床病理特征,在个体水平上对患者进行预测的研究较少,特别是风险(概率)的预测。准确的风险预测可以帮助临床医生针对个性化患者制定最佳的治疗方案,改善病人的生存状态,延长他们的生存时间,是实现精准医疗的重要途径。针对上述问题,本研究试图将概率校准应用于集成方法中,构建性能优良的DLBCL死亡风险(概率)预测模型,为医生决策和病人治疗提供参考。方法:研究资料来源于2010-2017年某医院确诊的406例DLBCL的电子病历记录。本研究综合Cox比例风险回归模型、logistic回归模型以及随机森林特征重要性分析结果,筛选风险模型的预测因子。本研究选择5个具有良好分类性能的分类器作为集成方法中的基模型,包括:朴素贝叶斯(NB)、logistic回归(LR)、随机森林(RF)、支持向量机(SVM)和前馈神经网络(FNN)模型。本研究选择普适性较好的RPR(shape-restricted polynomial regression)作为本文的概率校准方法。首先使用RPR对基模型进行概率校准,并与经典校准方法Platt(Platt scaling)和Iso Reg(isotonic regression)的结果进行比较。然后使用3种集成策略(stacking方法、加权平均法和简单平均法)组合RPR校准后的基模型,获得最终的风险预测模型。最后使用300轮留出法测试的平均结果评估模型性能。模型评价基于区分度和校准度,本文使用AUC(the area under the ROC curve)评价模型的区分性能(即分类能力),使用HL(Hosmer-Lemeshow)拟合优度检验、期望校准误差(expected calibration error,ECE)和最大校准误差(maximum calibration error,MCE)评价模型的校准性能(即概率预测的准确性)。结果:患者的性别、肿瘤分期、国际预后指数值(international prognostic index,IPI)、卡式状态评分值(Karnofsky performance status,KPS)和是否使用利妥昔单抗(rituximab)是DLBCL患者两年内死亡的重要影响因素。对于5个基模型,LR模型(ECE=9.517,MCE=24.400,P=0.226)和FNN模型(ECE=9.211,MCE=23.500,P=0.329)具有良好的校准性能,无论哪一种概率校准方法都没有进一步降低它们的概率预测误差。NB模型(ECE=14.206,MCE=38.900,P<0.001)、RF模型(ECE=13.569,MCE=36.000,P<0.001)和SVM模型(ECE=13.225,MCE=32.100,P=0.014)初始概率预测的误差较大,概率校准能够显著降低它们的预测误差,且RPR校准效果最优(NB-RPR:ECE=9.514,MCE=23.800,P=0.257;RF-RPR:ECE=10.070,MCE=26.550,P=0.198;SVM-RPR:ECE=10.893,MCE=26.300,P=0.140)。对于集成模型,无论使用何种集成策略(stacking方法、加权平均法、简单平均法),基模型经过概率校准的集成模型性能(Stacking-EN-C:ECE=8.983,MCE=21.265,P=0.350;ECE-EN-C:ECE=9.027,MCE=22.350,P=0.351;MCE-EN-C:ECE=9.159,MCE=22.300,P=0.345;SA-EN-C:ECE=9.295,MCE=23.300,P=0.314)优于基模型未经概率校准的集成模型(StackingEN:ECE=9.866,MCE=24.850,P=0.225;ECE-EN:ECE=9.228,MCE=24.500,P=0.186;MCE-EN:ECE=9.317,MCE=24.200,P=0.204;SA-EN:ECE=9.695,MCE=26.100,P=0.130)。在本文构建的28个模型中,通过RPR校准基模型的stacking异质集成模型(Stacking-EN-C)在区分度和校准度上均最优(AUC=0.820,ECE=8.983,MCE=21.265,P=0.350)。结论:针对集成方法的基模型在概率预测任务中可能无法产生准确概率估计的问题,本文将概率校准应用于集成方法中,以期产生更优越的集成效果,获得更精确的概率预测。结果显示,与基模型未经校准的集成模型相比,引入概率校准可以进一步降低集成模型的概率预测误差。本研究基于概率校准和集成方法构建的DLBCL风险预测模型达到了预期效果,对辅助医生决策和病人治疗具有重要意义。同时,本文应用的建模策略或许可以在以后的工作中被加以考虑。
其他文献
目的:甲状腺癌检出率升高日益显著,虽发病率的升高并未带来死亡率的明显升高,但淋巴结转移复发及远处转移是患者生存质量下降和死亡的主要原因。因此对于实行精准诊疗,许多学者专注于探索甲状腺癌发病分子机制及肿瘤标志物。长链非编码RNA-PVT1已经证实在多种癌组织、癌细胞系中高表达,索拉非尼已用于碘难治性分化型甲状腺癌的治疗。本文主要目的在于研究敲低非编码长链RNA-PVT1,应用分子靶向药物索拉非尼以及
目的:本课题计划在肝细胞癌(Hepatocellular carcinoma,HCC)的多系细胞系中对lncRNA HAND2-AS1的表达量进行鉴定,并在此基础上深入探究其在HCC细胞系的侵袭迁移和增殖中发挥的功能。对其在肝癌的始发与发展中的机制展开探讨,从而为HCC的临床治疗带来新的靶标。方法:1通过RT-PCR检测lncRNA HAND2-AS1在不同HCC细胞系中的表达情况,正常肝细胞系L
目的:探究环氧合酶-2(COX-2)和核受体共激活因子5(NCOA5)在甲状腺乳头状癌淋巴结转移中的表达模式,用来确定其对甲状腺乳头状癌淋巴结转移的预测意义,同时探究术前能够明确甲状腺结节性质的敏感及特异性因素,以便对甲状腺结节性质准确的评估,可以更好的指导患者的下一步管理进而指导临床精准治疗。方法:1、收集2019年度山西医科大学第一医院因甲状腺结节行手术治疗的患者共183例,其中甲状腺乳头状癌
第一部分基于增强CT影像组学在预测肾透明细胞癌核分级的应用目的:使用基于增强CT影像组学特征联合机器学习预测肾透明细胞癌(cc RCC)WHO/ISUP病理核分级。方法:回顾性分析术后病理证实的141例cc RCC患者,WHO/ISUP分级I-II级为低级别组共88例,III-IV级为高级别组共53例。动、静脉期CT图像手工勾画肿瘤感兴趣区,原始图像和滤波转换后共提取1706个组学特征,病例按7:
目的:初步探讨p21和REST基因与肥大细胞诱导雄激素非依赖性前列腺癌细胞出现神经内分泌分化的相关性。方法:利用孔径为0.4μm的Transwell小室将人前列腺癌细胞系(PC-3)与肥大细胞(P815)进行共培养,倒置显微镜观察诱导前后PC-3细胞的形态变化;CCK-8实验及平板克隆形成实验检测诱导前后PC-3的细胞活性及增殖能力变化;q RT-PCR实验检测诱导前后PC-3细胞中神经内分泌标志
目的:18F-DCFPy L标记的PSMA PET/CT是当前国际上诊断前列腺癌的先进的核医学显像技术。本研究的目的是初步比较18F-DCFPy L PET/CT与多参数核磁对初诊前列腺癌的检测效能,并评估前列腺癌病灶的最大标准摄取值与前列腺癌恶性程度的相关性。方法:通过回顾性分析2019年5月至2020年9月期间在山西白求恩医院核医学科行18F-DCFPy L PET/CT检查的27例患者的临床
目的:肝癌是全球第四大癌症相关死因,肝细胞癌是肝癌的主要形式,约占75%-85%。手术切除是肝癌最有效的治疗手段。然而,大都数肝癌恶性度高、容易复发等特点导致其预后较差。目前对于以上导致不良预后的确切分子机制尚不完全清楚。对肝癌发生发展的深入探索,可以增强我们对肿瘤相关机制的理解,有助于发现有效的HCC治疗策略。大量研究证明DNA拓扑异构酶II-alpha(TOP2A)参与细胞的多种生理活动,在肿
目的:本研究旨在探究:1.明确miR-6883-5p可否在乳腺癌中调控CDK4的表达;2.细胞层面探究miR-6883-5p在乳腺癌中的生物学功能及其调控作用机制通路;3.从组织层面研究miR-6883-5p的表达水平,评估其与临床病例相关性。方法:1.用miRBase、Targetscan、Pic Tar三个预测软件进行靶点预测,预测出来的靶基因取其交集,最终将miR-6883-5p作为后续实验
目的:研究免疫检查点分子T细胞免疫球蛋白和ITIM结构域(TIGIT)在胶质瘤中的表达情况,并初步探讨其与临床病理特征、预后的关系。方法:根据排纳标准,获取2018年10月到2020年10月于山西医科大学第一医院神经外科首次行手术治疗且病理诊断明确的54位胶质瘤患者的肿瘤组织和18例行开颅手术治疗的非肿瘤患者的脑组织。通过免疫组织化学染色方法分析TIGIT在胶质瘤中的表达情况及与临床病理特征和预后
目的:通过分析前白蛋白/纤维蛋白原比值(prealbumin-to-fibrinogen ratio,PFR)、白蛋白/纤维蛋白原比值(albumin-to-fibrinogen ratio,AFR)与结直肠癌患者一般临床特征的关系、与CEA、CA19-9的相关性以及对化疗疗效的预测价值,探索PFR、AFR表达水平在结直肠癌中的临床意义。方法:选取2016年1月至2020年9月底期间就诊于山西医科