论文部分内容阅读
背景与目的:肝细胞癌(以下简称肝癌)是一种常见的消化系统恶性肿瘤,在我国发病率高,患者预后普遍较差。目前对肝癌发生发展机制的深入研究已发现多种治疗靶点,有效改善了部分患者的临床预后,但其作用仍然有限,亟需突破性的治疗新靶点。泛素-蛋白酶体系统是细胞蛋白质降解主要的途径,而E3泛素连接酶(E3ubiquitin ligase,E3)是该途径中功能最复杂的一类成员。多种E3已被证实在恶性肿瘤的发生发展中发挥重要的调节作用,然而目前E3在肝癌中的作用尚未完全明确。生物信息学挖掘是一种热门的研究方法,可通过分析公共数据库的高通量测序数据及相应临床信息,挖掘潜在核心基因和预后标志物,并预测可能的生物学功能。本研究通过联合多种数据库,挖掘肝癌中核心的E3基因,探究其预后价值和潜在功能,以期获得新的潜在治疗靶点,为肝癌治疗研究提供新思路。方法:从ICGC(International Cancer Genome Consortium)数据库下载肝癌患者测序数据并筛选癌中高表达的基因(|log2FC|≥2)。通过IUUCD(Integrated annotations for Ubiquitin and Ubiquitin-like Conjugation Database)数据库获得E3基因列表,与高表达基因取交集,获得高表达的E3基因。应用STRING数据库构建蛋白互作网络后导入Cytoscape软件,计算基因的点度中心值,将点度中心值最高的基因视为核心E3基因(以下简称核心基因)。通过TCGA(The Cancer Genome Atlas)数据库、GEO(Gene Expression Omnibus)数据库的5组肝癌表达数据验证核心基因的表达差异。分析TCGA、ICGC、GSE14520队列中肝癌患者的临床信息及生存预后数据,绘制Kaplan-Meier生存曲线,探究核心基因的预后价值。联合TCGA数据库的表达数据以及临床信息,使用单因素和多因素Cox分析以及多因素ROC曲线图进一步验证核心基因的预后价值。通过GSEA(Gene set enrichment analysis)富集分析进一步探究核心基因的潜在生物学功能。通过TIMER(Tumor Immune Estimation Resource)数据库分析核心基因与肝癌中免疫细胞浸润及免疫细胞标志物分子之间的相关性,并通过GEPIA(Gene Expression Profiling Interactive Analysis)数据库验证。最后在临床样本中通过免疫组织化学染色验证核心基因的表达差异,分析核心基因与临床病理参数之间的相关性,并探究核心基因的生存复发预测价值。结果:在ICGC数据库筛选得到569个肝癌中高表达基因,与E3基因列表取交集后获得21个高表达的E3基因。在构建的蛋白互作网络中,CDC20的点度中心值最高且位于最核心的位置,作为肝癌中核心的E3基因。多个数据库的表达数据显示CDC20基因在肝癌组织中的表达都显著高于癌旁组织(P<0.05)。CDC20高表达的患者生存预后显著差于低表达的患者(P<0.05)。相关性分析显示CDC20的表达与病理分化程度和T分期相关,分化较差和T分期较晚的患者CDC20表达水平更高(P<0.05)。单因素和多因素Cox分析结果显示,CDC20具有独立预后预测价值(P<0.001)。多因素ROC曲线中,CDC20具有最高的曲线下面积(area under curve=0.728)。GSEA富集分析结果提示CDC20可能与T细胞受体信号通路有关。TIMER数据库的免疫细胞浸润分析结果显示在肝癌中CDC20的表达与B细胞、CD8+T细胞、巨噬细胞、中性粒细胞和树突状细胞的浸润程度有关(cor>0.3,P<0.05)。此外,TIMER数据库的结果还显示CDC20的表达与CD8+T细胞、T细胞(常规)、单核细胞和耗竭T细胞的标志物分子相关(cor>0.3,P<0.05)。GEPIA数据库的分析结果进一步证明CDC20表达与耗竭T细胞的标志物分子相关(R>0.3,P<0.05)。临床样本免疫组化结果显示CDC20在癌组织中显著高表达(P<0.05),且CDC20的表达与肝癌肿瘤大小具有相关性(P<0.05),高表达组肿瘤大小更大。生存和复发的Cox回归分析结果显示CDC20高表达是患者总体生存和累计复发的独立危险因素(P<0.05)。结论:(1)CDC20基因在肝癌组织中显著高表达。(2)CDC20的表达与肝癌的病理分化程度、T分期以及肿瘤大小相关,是患者生存和复发的独立危险因素,高表达CDC20的患者总体生存率较差、累计复发率较高。(3)CDC20的表达与肝癌组织中的T细胞浸润具有显著相关性,其基因表达可能通过影响肿瘤免疫调控肝癌的发生发展,具体机制有待进一步研究。