论文部分内容阅读
背景:肝癌是导致肿瘤相关死亡的主要原因之一,它威胁着全世界数千人的生命。肝细胞癌(HCC)是最常见的肝癌形式,手术切除和肝移植被公认为是治疗HCC的最有效方法。然而,目前这两种治疗方法的治疗效果远不能令人满意。如今肝细胞癌的免疫疗法正在深入研究中。尽管HCC的免疫治疗取得了一些进展,但治疗效果并不理想。因此,对HCC的免疫相关基因谱进行分析至关重要,进而可以为免疫治疗提供指导。目的:本课题主要通过对TCGA数据库数据分析,旨在:(1)通过生物信息学方法分析筛选肝细胞癌组织和癌旁组织的免疫相关差异基因,筛选预后相关的免疫差异基因,构建预后风险预测模型并对模型的预测效能进行评估;(2)通过统计学方法,分析免疫相关预后风险预测模型与临床性状的关系,探究其与免疫细胞的相关性及其潜在调控机制。方法:(1)通过TCGA数据库下载肝细胞癌表达谱数据及临床数据,通过ImmPort数据库下载免疫相关基因,应用R语言中的Bioconductor的“limma”包筛选出差异表达的免疫相关基因。(2)基于差异表达免疫相关基因进行单因素及多因素分析,从中筛选对HCC患者有独立预后作用的免疫相关基因,利用这些具有独立预后作用的免疫相关基因应用R语言“survival”包的coxph()功能拟合构建最优的免疫相关基因预后风险预测模型。(3)根据免疫基因模型将从TCGA数据库下载的肝细胞癌患者分为高风险组和低风险组,通过KM分析及ROC曲线来评估风险预测模型的效能。(4)应用R语言的“survival”包分析免疫相关预后风险预测模型与各临床性状的关系并评估该模型是否为HCC患者的独立预后因子。(5)通过TIMER数据库获得HCC肿瘤免疫细胞浸润数据,应用R语言分析免疫基因模型风险评分和6类免疫细胞(B细胞、CD4+T细胞、CD8+T细胞、巨噬细胞、中性粒细胞、树突状细胞)的关系。(6)通过R语言及Cytoscape软件构建基于转录因子的风险预测模型相关的调控网络。(7)通过STRING在线数据库(https://string-db.org/)构建能预测HCC预后的免疫相关基因的蛋白质-蛋白质相互作用网络,同时通过DAVID网站对这些基因进行GO及KEGG功能富集分析,探究这些基因的功能及通路。结果:(1)通过TCGA数据库获取了 374例肝细胞癌患者及50例癌旁对照患者的表达谱数据及相关临床信息,通过ImmPort数据库获取了 1181个免疫相关基因,应用差异表达分析得到116个差异免疫相关基因(96上调基因,20下调基因)。(2)通过单因素和多因素Cox分析,筛选出9个能独立预测肝细胞癌预后的免疫相关基因,这9个基因分别为BIRC5、DKK1、PTHLH、FGF13、SPP1、IL11、IL17D、FOS 和 PLXNA33。(3)通过R语言“survival”包的coxph 0功能我们构建了一个七基因的预后风险预测基因模型(Risk score=BIRC5*0.0238+FOS*0.0055+DKK1*0.0085+FGF13*0.3432+IL11*0.0135+IL17D*0.0878+SPP1*0.0003)。(4)我们进一步探究了免疫预后风险预测基因模型和临床性状、免疫细胞的关系,结果显示乙型病毒性肝炎感染患者与高免疫模型风险评分显著相关,相关系数为2.096。(5)另外,免疫模型风险评分与B细胞、CD8 T+细胞、巨噬细胞、中性粒细胞、树突状细胞浸润明显相关(p<0.05),相关系数分别为0.117,0.277,0.282,0.188 和 0.238。(6)此外,我们还构建了免疫预后风险预测基因模型与转录因子相关的调控网络。(7)同时我们构建了 HCC预后相关免疫相关基因的蛋白质-蛋白质相互作用网络,并且分析了这些基因富集的相关通路。结论:我们通过使用癌症基因组图谱(TCGA)数据库中的数据,构建了一个具有预测肝细胞肝癌预后能力的七基因免疫相关风险预测模型。同时,我们评估了这一免疫基因模型与临床特征之间的相关性,证实风险评分与乙肝病毒感染密切相关。我们还通过生物信息学分析探索了免疫基因模型和免疫细胞浸润的关系及其潜在调控机制,这些结果对于肝细胞癌免疫治疗具有指导意义。