论文部分内容阅读
目的:本研究旨在评估检查的淋巴结(Examined Lymph Nodes,ELNs)数量的预后价值,并提出一种新颖的生物标志物的筛选方法,基于预后相关标志物构建胃癌(Gastric Cancer,GC)预后ELNs风险特征模型和列线图模型来预测患者的总生存期(Overall Survival,OS),以期识别高危人群和预测治疗效果,并对预后ELNs风险特征模型中的基因CDKN2B-AS1的表达特征在泛癌中的潜在分子机制和预后作用进行深入调查和分析。方法:1)这项初始队列研究包括来自美国监测、流行病学和最终结果(Surveillance,Epidemiology,and End Results,SEER)数据库的19,317名GC患者,将该数据库数据以2:1随机分为训练集和内部验证集。使用受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC)确定ELNs数量的最佳临界值。基于最佳临界值将GC患者分为高ELNs组和低ELNs组。Kaplan-Meier(K-M)曲线用于评估ELNs组的预后价值。使用训练集构建列线图预测模型,然后分别使用内部SEER数据、癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据集(396名STAD患者)和新疆医科大学附属肿瘤医院数据集(471名GC患者)进行验证,并通过一致性指数(Concordance-index,C-index)、校准图、ROC曲线和决策曲线分析(Decision Curve Analysis,DCA)进行评估。以PSM分析作为敏感性分析。2)分子水平上,基于TCGA-STAD患者的转录组数据,识别与ELNs数量相关的DERNAs(DElnc RNA、DEmi RNA和DEm RNA)和肿瘤浸润免疫细胞(Tumor-Infiltrating Immune Cells,TIICs)。在TCGA-STAD队列中,利用最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator,LASSO)-Cox回归分析构建ELNs相关的DERNAs和TIICs特征。K-M分析用于比较高和低ELNs特征组之间的OS。基于ELNs特征和其他临床特征构建列线图。列线图模型通过C-index、校准图、ROC曲线和DCA进行评估。Meta分析、GEPIA数据库和逆转录定量PCR(Reverse transcription-quantitative PCR,RT-q PCR)分别用于验证GC组织和正常胃组织之间预后基因和TIICs的表达和丰度。此外,ELNs特征用于预测患者治疗疗效分析以及相关机制分析。3)从UCSC Xena数据库下载TCGA泛癌队列的癌症和正常组织测序数据。Mann-Whitney U检验用于评估癌组织和非癌组织之间CDKN2B-AS1表达的差异。使用单因素Cox回归和K-M曲线分析评估CDKN2B-AS1对每种癌症特定预后类型(总生存期、无进展生存期、非疾病生存期和疾病特异性生存期)的预后作用。使用c Bio Portal工具分析不同癌症中CDKN2B-AS1的突变特征。EWAS数据库被用于分析生存时间与CDKN2B-AS1启动子甲基化水平之间的关系。关于CDKN2B-AS1的免疫相关特征分析包括,通过Spearman相关性分析,评估CDKN2B-AS1的表达与多种癌症类型的免疫评分、基质评分和估计评分的相关性。基于TIMER2.0数据库获得通过不同算法评估的TIICs水平,并探索CDKN2B-AS1表达与它们之间的关系。通过Spearman相关分析以研究TCGA队列中不同肿瘤中CDKN2B-AS1表达与微卫星不稳定性(Microsatellite instability,MSI)评分、肿瘤突变负荷(Tumor Mutation Burden,TMB)值之间的关系。此外,通过Sanger Box3.0网站探索多个肿瘤中CDKN2B-AS1表达与其他免疫相关基因(包括趋化因子、趋化因子受体、MHC基因、免疫抑制剂、免疫刺激剂和免疫检查点基因)的相关性。Bio GRID数据库和GEPIA2.0数据库用于获得与CDKN2B-AS1相关的基因。基于CDKN2B-AS1的相关基因,进行基因本体(Gene Ontology,GO)和京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析。使用33种癌症的TCGA数据分别进行CDKN2B-AS1与所有基因的相关性分析,计算批量spearman相关系数,并进行基因集富集分析(Gene Set Enrichment Analysis,GSEA)。使用Cancer SEA数据库和TISCH数据库在单细胞测序水平上评估CDKN2B-AS1的肿瘤生物学相关功能状态以及CDKN2B-AS1在每种细胞类型中的表达水平。利用ICBatlas数据库评估CDKN2B-AS1的表达对免疫治疗响应的影响。进一步,通过IMvigor210队列分析CDKN2B-AS1的预后价值。最后,通过肿瘤免疫功能障碍和排斥(TIDE)算法预测免疫治疗反应。TIDE评分高的患者表现出较高的肿瘤免疫逃逸机会,从而表现出较低的免疫治疗应答率。结果:1)基于SEER训练集,ELNs数量的最佳临界值为16个。多变量Cox回归分析显示,与低ELNs相比,高ELNs改善了OS[风险比(Hazard Ratio,HR)=0.659,95%置信区间(Confidence Intervals,CIs):0.626-0.694,P<0.0001]。使用训练集构建了一个包含ELNs的列线图模型,并证明其具有良好的校准和辨别能力(C-index[95%CI],0.714[0.710-0.718]),此模型分别在内部验证集(C-index[95%CI],0.720[0.714-0.726])、TCGA-STAD数据集(C-index[95%CI],0.693[0.662-0.724])和肿瘤医院数据集(C-index[95%CI],0.750[0.720-0.782]也进行了验证。PSM结果显示ELNs是GC患者OS的独立危险因素。2)通过LASSO-Cox回归分析构建了基于ELNs组、调节性T细胞(Tregs)、中性粒细胞、CDKN2B-AS1、H19、HOTTIP、LINC00643、MIR663AHG、TMEM236、ZNF705A和hsa-mi R-135a-5p的ELNs相关特征模型。结果显示,与低ELNs特征组相比,高ELNs特征组的患者OS显著较差(HR=2.418,95%CI=1.804-3.241,P<0.001)。该特征在预测1年、3年和5年生存率方面具有良好的性能(分别为:AUCs[95%CI]=0.688[0.612,0.763]、0.744[0.659,0.830]和0.778[0.647,0.909])。单因素和多因素Cox回归分析显示,ELNs特征是GC患者OS的独立预测因子。ELNs特征联合其他独立的临床病理学预后因素构建的列线图模型用于预测GC患者1年、3年和5年OS的ROC曲线下面积AUC分别为:AUCs[95%CI]=0.742[0.675,0.808]、0.768[0.686,0.849]和0.813[0.692,0.934],C-index为0.710(95%CI:0.680-0.740),且校准图和DCA表明列线图具有良好的预测性能及临床适用性。Meta分析、GEPIA数据库和RT-q PCR结果显示,ELNs特征中的预后基因(LINC00643、TMEM236和hsa-mi R-135a-5p)的表达在GC组织和相邻非肿瘤组织之间具有差异。此外,ELNs特征与N分期和T分期显著相关。治疗疗效评价结果提示,低ELNs特征组的GC患者对大多数化疗药物更敏感,低ELNs特征组GC患者的TIDE评分较低,表明低ELNs特征组可能具有更好的免疫治疗反应。富集分析表明,细胞发育、增殖相关途径在高ELNs特征组的患者中显著富集,而免疫相关通路如干扰素α应答在低ELNs特征组的患者中显著富集。3)CDKN2B-AS1在多种肿瘤中高表达。其与6种人类肿瘤的肿瘤分期显著相关,包括ACC、KICH、KIRC、LIHC、THCA和UVM。CDKN2B-AS1表达水平与33种肿瘤的OS、DSS、DFS和PFS 4种预后指标的Cox回归分析结果显示,在OS分析中,CDKN2B-AS1表达与STAD、ACC、KICH、KIRC、LIHC、PCPG、THCA和UCEC中的OS呈负相关。在DSS分析中,CDKN2B-AS1高表达与ACC、KICH、KIRC、PRAD、THCA和UCEC患者的预后不良相关。在KIRP和LIHC患者中,CDKN2B-AS1高表达与不良DFS相关。在PFS分析中,CDKN2B-AS1高表达是ACC、KICH、KIRC、LICH、THCA、UCEC和UVM患者的风险因子。具有CDKN2B-AS1突变的癌症患者在OS、DSS、DFS和PFS方面的预后更差。在多种癌症中CDKN2B-AS1启动子甲基化水平与CDKN2B-AS1表达相关。此外,CDKN2B-AS1表达与多种肿瘤中的大多数免疫相关基因和免疫检查点(Immune Checkpoints,ICPs)基因呈显著正相关以及与TMB和MSI显著相关。机制分析表明,较高的CDKN2B-AS1表达与癌症的免疫激活状态和增殖相关。结论:第一部分研究从宏观水平上基于大型SEER中的胃癌临床大数据以ELNs为所研究的目标变量,通过ELNs将胃癌患者分为2组不同的表型组,建立包含ELNs的列线图预后模型。同时,也探索出胃癌预后的其他临床指标。列线图模型在内部验证集、TCGA-STAD数据集及本研究的胃癌队列中均表现出良好的预测效果。第二部分研究从分子水平上,基于TCGA本研究构建了与GC预后相关的ELNs特征。结果表明,该特征是GC患者的有效预测指标,可以识别高危人群,并进行治疗效果评价。采用GEO、GEPIA数据库以及RT-q PCR实验探讨了ELNs特征中关键预后指标(基因或/和肿瘤免疫细胞)与胃癌患者预后的相关性,验证了ELNs特征的适用性和可靠性。该特征可能包含用于预测GC患者治疗反应的潜在生物标记物。此外,本研究还确定了一种结合ELNs特征和临床因素的新颖、稳健的列线图,用于预测GC患者的1年、3年和5年生存率,这将有助于GC患者的个性化生存预测和临床决策。第三部分研究利用TCGA包括的33种癌症,首次对CDKN2B-AS1进行了泛癌分析,探讨了CDKN2B-AS1在泛癌中的表达水平、临床预后、遗传改变和免疫调节等作用。结果表明,CDKN2B-AS1的过度表达通常预示着癌症患者的不良预后,是泛癌的一个稳健的预后生物标志物,并有效预测免疫治疗反应,有望成为肿瘤免疫治疗的靶点,同时,也探讨了CDKN2B-AS1的在肿瘤中的潜在机制。三部分的研究从宏观水平和分子水平上利用生物信息学技术分别建立了胃癌预后预测模型,以期探索出胃癌预后的临床指标和新的生物标志物,全面逐渐深入的理解胃癌的发病机制。