论文部分内容阅读
背景与目的缺氧、上皮间质转化、肿瘤免疫微环境三者密切相关,并且它们在乳腺癌的进展和转移中起着重要作用,本研究旨在构建基于免疫相关缺氧和上皮间质转化基因的乳腺癌新型预后风险评分模型。方法从TCGA和GEO数据库下载乳腺癌(BRCA)的转录组数据分别作为训练集和验证集。分别从Imm Port数据库、MSig DB和db EMT 2.0数据库下载免疫相关基因(IRGs)、缺氧相关基因(HRGs)和上皮间质转化相关基因(EMTRGs)。确定TCGA队列中差异表达的IRGs,再通过单因素Cox分析筛选与总生存期(OS)相关的IRGs并进行GO和KEGG功能富集分析。根据有预后价值的HGRs和EMTRGs对TCGA队列的BRCA患者进行共识聚类分析确定缺氧相关亚型和上皮间质转化(EMT)相关亚型。PCA分析和Kaplan-Meier生存曲线评估分型的有效性,通过GSEA、GSVA分析探索分型之间的功能差异。识别出分型间的差异表达基因,通过设置pearson相关系数阈值进行基因共表达分析筛选出与免疫相关的缺氧及EMT基因。LASSO回归分析用于构建风险评分模型。Kaplan-Meier曲线和ROC曲线评估模型的预测性能,并用GEO数据集进行验证。为了研究潜在机制,我们进行了功能富集分析如KEGG、GO和GSEA。结合临床特征和风险评分,利用“rms”包构建列线图。应用ESTIMATE和ss GSEA算法来评估两个风险组的免疫状态。我们还分析了风险评分模型与临床特征和肿瘤突变负荷(TMB)的相关性。结果在TCGA队列中共筛选出了67个有预后价值的差异表达IRGs。通过单因素Cox分析得到了17个HGRs和107个EMTRGs与OS相关。在此基础上,我们确定了两种缺氧亚型(A和B)和两种EMT亚型(C1和C2),并观察到A和B之间以及C1和C2之间都有明显的生存差异和空间分布。我们发现缺氧亚型中预后较好的亚型有较低的缺氧状态,较高EMT状态的亚型与不良预后相关。通过亚型间的差异表达分析和单因素Cox分析得到与预后相关的缺氧差异表达基因和EMT差异表达基因。进行共表达分析确定了46个免疫相关缺氧基因和153个免疫相关EMT基因,两个基因集有15个交叉基因。利用LASSO回归分析构建了由13个基因(STC2、SCUBE2、TPRG1、TFF1、FAM234B、ARMT1、RARRES1、LAMP3、IDO1、FABP7、MMP1、CHI3L1、CXCL9)构成的预后风险评分模型。生存分析显示,高风险组相比于低风险组有更差的预后。并且在训练队列(AUCmax=0.740)和验证队列(AUCmax=0.634)中均表现出可靠的预测能力。此外,该风险评分模型是BRCA患者的独立预后因素(p<0.001)。整合风险评分、年龄和分期的列线图可以准确预测BRCA患者的生存率。临床相关性分析显示高风险评分与较晚的TNM分期、较高的年龄段、较高的肿瘤分级和较差的临床预后显著相关。预后较好的低风险组有较高的免疫状态。与低风险组相比,高风险组的TMB更高,且TMB与风险评分呈正相关。结论本研究基于免疫、缺氧和EMT基因特征构建了一个新型预后风险评分模型,可作为BRCA的独立预后标志物,并且与肿瘤免疫微环境密切相关。