论文部分内容阅读
研究目的:
免疫检查点抑制剂(Immune checkpoints blockade, ICB)治疗极大的延长了肺腺癌(Lung adenocarcinoma, LUAD)患者的生存期。但在实际的临床治疗中,仅有很少的一部分病人能够从中受益。当前ICB治疗广泛应用的生物标志物虽然在一定程度上能够预测患者治疗的获益程度,但是较低的回应率驱使我们寻找新的更有效的免疫治疗预测指标。
研究方法:
我们收集了来自肿瘤基因组图谱(The Cancer Genome Atlas, TCGA)和基因表达公共数据库(Gene Expression Omnibus, GEO)10个队列的2300例肺腺癌样本的全基因组表达数据和临床信息,其中TCGA样本作为训练集,GEO样本作为验证集。2995个免疫相关的基因收集于TCGA泛癌症免疫图谱项目,免疫基因的表达水平与肺腺癌患者预后的关系利用单因素Cox比例风险模型(Cox回归)进行评估。潜在的分子亚型利用非负矩阵分解(Nonnegative matrix factorization, NMF)算法进行鉴定。不同亚型患者ICB免疫治疗的获益程度利用TIDE(Tumor Immune Dysfunction and Exclusion)算法进行评估。PD-L1表达和TMB在不同亚型的差异利用Wilcoxon秩和检验进行计算。基因集富集分析(Gene set enrichment analysis, GSEA)用于计算不同亚型之间信号通路富集的差异。MutSigCV算法用于确定肺腺癌患者的显著突变基因(Significantly mutated genes, SMG)。
研究结果:
1.TCGA训练集中,433个基因的表达与肺腺癌患者的预后存在显著相关性(FDR<0.05)。我们利用433个预后免疫基因对TCGA患者进行NMF聚类分析,发现当聚类个数为2时,模型评估系数能获得最大值,初步确定肺腺癌存在两个潜在的分子亚型。生存分析表明,两个亚型具有显著不同的生存结局(HR:1.99,95%CI:1.43-2.76,LogrankP<0.001),校正混杂变量的多因素Cox回归模型仍然具有统计学意义(HR:1.80,95%CI:1.28-2.53,P<0.001)。在GEO的9个独立的肺腺癌数据集中,8个数据集所确定的两个亚型也具有显著不同的生存结局,差异具有统计学意义(LogrankP<0.01),另外一个数据集表现出相同的趋势,但没有达到统计学差异(LogrankP=0.092)。我们将预后较差的肺腺癌亚型命名为‘‘高风险亚型’’,预后较好的命名为‘‘低风险亚型’’。
2.TCGA结果表明,相对于低风险亚型,高风险亚型患者具有更低的TIDE分数(Wilcoxon秩和检验,P<0.001);TIDE分数越低,代表肿瘤细胞免疫逃逸的可能性越低,因此具有更好的免疫微环境;包含临床变量的多因素Logistic回归模型结果仍然具有统计学意义(OR:0.13,95%CI:0.08-0.20,P<0.001)。GEO的9个验证数据集也得到了相似的结果(Wilcoxon秩和检验,所有P<0.05)。
3.TCGA队列和包含PD-L1表达数据的7个数据集中,与低风险亚型相比,高风险亚型患者具有显著更高的PD-L1表达水平(Wilcoxon秩和检验,P<0.05)。TCGA队列中,高风险亚型患者具有更高的TMB,差异具有统计学意义(Wilcoxon秩和检验,P<0.001)。我们将临床变量,提取的突变特征和DNA损伤修复基因的突变纳入多因素Logistic回归模型以消除假阳性结果,结果表明高风险亚型患者仍然具有显著更高的TMB(OR:3.99,95%CI:2.19-7.46,P<0.001)。
4.GSEA结果表明,细胞周期相关的信号通路能够显著富集到高风险亚型患者(FDR<0.05),细胞周期各阶段相关检查点基因的表达水平在高风险亚型也显著上调(Wilcoxon秩和检验,所有P<0.001)。
5.TCGA队列中,单因素和多因素分析显示,TP53,NAV3,COL11A1,KEAP1和SMARCA4在高风险患者中具有显著更高的突变率(OR>1,P<0.01)。我们利用包含TP53突变信息的3个数据集验证了高风险亚型和TP53高突变率的这一相关性。
研究结论:
本研究通过对2300例肺腺癌样本的免疫相关基因组学的分析,鉴定了肺腺癌预后不同的高风险和低风险亚型。其中,高风险亚型具有更低的TIDE分数,更高的PD-L1表达水平、TMB和显著激活的细胞周期、TP53突变。肺腺癌高风险亚型接受ICB免疫治疗可能会获得更好的治疗效果。
免疫检查点抑制剂(Immune checkpoints blockade, ICB)治疗极大的延长了肺腺癌(Lung adenocarcinoma, LUAD)患者的生存期。但在实际的临床治疗中,仅有很少的一部分病人能够从中受益。当前ICB治疗广泛应用的生物标志物虽然在一定程度上能够预测患者治疗的获益程度,但是较低的回应率驱使我们寻找新的更有效的免疫治疗预测指标。
研究方法:
我们收集了来自肿瘤基因组图谱(The Cancer Genome Atlas, TCGA)和基因表达公共数据库(Gene Expression Omnibus, GEO)10个队列的2300例肺腺癌样本的全基因组表达数据和临床信息,其中TCGA样本作为训练集,GEO样本作为验证集。2995个免疫相关的基因收集于TCGA泛癌症免疫图谱项目,免疫基因的表达水平与肺腺癌患者预后的关系利用单因素Cox比例风险模型(Cox回归)进行评估。潜在的分子亚型利用非负矩阵分解(Nonnegative matrix factorization, NMF)算法进行鉴定。不同亚型患者ICB免疫治疗的获益程度利用TIDE(Tumor Immune Dysfunction and Exclusion)算法进行评估。PD-L1表达和TMB在不同亚型的差异利用Wilcoxon秩和检验进行计算。基因集富集分析(Gene set enrichment analysis, GSEA)用于计算不同亚型之间信号通路富集的差异。MutSigCV算法用于确定肺腺癌患者的显著突变基因(Significantly mutated genes, SMG)。
研究结果:
1.TCGA训练集中,433个基因的表达与肺腺癌患者的预后存在显著相关性(FDR<0.05)。我们利用433个预后免疫基因对TCGA患者进行NMF聚类分析,发现当聚类个数为2时,模型评估系数能获得最大值,初步确定肺腺癌存在两个潜在的分子亚型。生存分析表明,两个亚型具有显著不同的生存结局(HR:1.99,95%CI:1.43-2.76,LogrankP<0.001),校正混杂变量的多因素Cox回归模型仍然具有统计学意义(HR:1.80,95%CI:1.28-2.53,P<0.001)。在GEO的9个独立的肺腺癌数据集中,8个数据集所确定的两个亚型也具有显著不同的生存结局,差异具有统计学意义(LogrankP<0.01),另外一个数据集表现出相同的趋势,但没有达到统计学差异(LogrankP=0.092)。我们将预后较差的肺腺癌亚型命名为‘‘高风险亚型’’,预后较好的命名为‘‘低风险亚型’’。
2.TCGA结果表明,相对于低风险亚型,高风险亚型患者具有更低的TIDE分数(Wilcoxon秩和检验,P<0.001);TIDE分数越低,代表肿瘤细胞免疫逃逸的可能性越低,因此具有更好的免疫微环境;包含临床变量的多因素Logistic回归模型结果仍然具有统计学意义(OR:0.13,95%CI:0.08-0.20,P<0.001)。GEO的9个验证数据集也得到了相似的结果(Wilcoxon秩和检验,所有P<0.05)。
3.TCGA队列和包含PD-L1表达数据的7个数据集中,与低风险亚型相比,高风险亚型患者具有显著更高的PD-L1表达水平(Wilcoxon秩和检验,P<0.05)。TCGA队列中,高风险亚型患者具有更高的TMB,差异具有统计学意义(Wilcoxon秩和检验,P<0.001)。我们将临床变量,提取的突变特征和DNA损伤修复基因的突变纳入多因素Logistic回归模型以消除假阳性结果,结果表明高风险亚型患者仍然具有显著更高的TMB(OR:3.99,95%CI:2.19-7.46,P<0.001)。
4.GSEA结果表明,细胞周期相关的信号通路能够显著富集到高风险亚型患者(FDR<0.05),细胞周期各阶段相关检查点基因的表达水平在高风险亚型也显著上调(Wilcoxon秩和检验,所有P<0.001)。
5.TCGA队列中,单因素和多因素分析显示,TP53,NAV3,COL11A1,KEAP1和SMARCA4在高风险患者中具有显著更高的突变率(OR>1,P<0.01)。我们利用包含TP53突变信息的3个数据集验证了高风险亚型和TP53高突变率的这一相关性。
研究结论:
本研究通过对2300例肺腺癌样本的免疫相关基因组学的分析,鉴定了肺腺癌预后不同的高风险和低风险亚型。其中,高风险亚型具有更低的TIDE分数,更高的PD-L1表达水平、TMB和显著激活的细胞周期、TP53突变。肺腺癌高风险亚型接受ICB免疫治疗可能会获得更好的治疗效果。