论文部分内容阅读
肝细胞癌(Hepatocellular carcinoma,HCC)为最常见的肝癌类型,对人类的健康造成重要威胁。有关HCC已有不同角度的多种大量研究,但迄今对其确切发生机制仍不明确。随着肿瘤精准治疗的提出,HCC的研究也进行了基于基因突变及全基因组学领域的较多探讨。生物信息学技术的发展为挖掘肿瘤相关基因及发病机理提供了重要的方法,也有助于HCC研究领域新的探索。
目的:利用多个数据库挖掘与HCC相关的核心基因并明确其作用机制。
方法:GEO数据库下载GSE45267、GSE60502、GSE74656数据集,3个数据集均包含HCC组及对照组样本。应用“limma”R包筛选3个数据集中HCC组与对照组之间的差异表达基因(Differentially expressed genes,DEGs)。再应用“Robust rank aggregation(RRA)”R包对3个数据集得出的DEGs进行聚合分析,得出3个数据集的“聚合DEGs”。用DAVID和KOBAS3.0数据库进行分析,获得“聚合DEGs”参与的生物学通路和可能有关的GO和KEGG通路。用STRING数据库分析“聚合DEGs”的蛋白质相互作用网络(PPI),并得到核心基因。用GSEA数据库验证DAVID和KOBAS3.0数据库分析的结果。从TCGA数据库下载HCC患者信息,应用“Survminer”R包分析每个核心基因与肝癌患者预后的关系,并分析核心基因mRNA表达量在不同临床特征中的表达差异。
结果:从GSE45267、GSE60502和GSE74656中分别筛选出7583、2349和553个DEGs。经“RRA”方法聚合分析后筛选出221个“聚合DEGs”,主要富集在109条GO通路和29条KEGG通路。其中细胞周期阶段(Cellcycle phase,adj.pval=5.57E-14)、有丝分裂细胞周期(Mitotic cell cycle,adj.pval=1.45E-13)、细胞分裂(Cell division,adj.pval=2.62E-13)、核分裂(Nuclear division,adj.pval=2.76E-13)、有丝分裂(Mitosis,adj.pval=2.76E-13)是最显著的GO通路。代谢途径(Metabolic pathways,p-value=8.71E-12)、细胞周期(Cell cycle,p-value=1.48E-10)、化学致癌性(Chemical carcinogenesis,p-value=5.45E-09)、视黄醇新陈代谢(Retinol metabolism,p-value=1.18E-08)、脂肪酸降解(Fatty acid degradation,p-value=1.36E-08)是主要的KEGG通路。PPI分析结果筛选出9个核心基因(TOP2A、NDC80、CDK1、CCNB1、KIF11、BUB1、CCNB2、CCNA2和TTK),生存分析显示它们都与HCC患者的预后相关,p值分别为0.0042(TOP2A)、0.0012(NDC80)、0.0012(CDK1)、0.00024(CCNB1)、0.00044(KIF11)、0.00015(BUB1)、0.049(CCNB2)、0.0065(CCNA2)和0.0016(TTK)。9个核心基因的mRNA表达量在不同的年龄、种族、组织学类型、病理学分期、肿瘤复发情况和生存状态中分布存在显著差异(p<0.05),在不同的性别和Child-Pugh分级中的分布无明显差异。
结论:本研究鉴别出,TOP2A、NDC80、CDK1、CCNB1、KIF11、BUB1、CCNB2、CCNA2和TTK为HCC的核心基因。这些核心基因参与细胞周期、有丝分裂等多种重要生物学途径,可能是HCC的潜在的生物标志物和HCC治疗的靶点。
目的:利用多个数据库挖掘与HCC相关的核心基因并明确其作用机制。
方法:GEO数据库下载GSE45267、GSE60502、GSE74656数据集,3个数据集均包含HCC组及对照组样本。应用“limma”R包筛选3个数据集中HCC组与对照组之间的差异表达基因(Differentially expressed genes,DEGs)。再应用“Robust rank aggregation(RRA)”R包对3个数据集得出的DEGs进行聚合分析,得出3个数据集的“聚合DEGs”。用DAVID和KOBAS3.0数据库进行分析,获得“聚合DEGs”参与的生物学通路和可能有关的GO和KEGG通路。用STRING数据库分析“聚合DEGs”的蛋白质相互作用网络(PPI),并得到核心基因。用GSEA数据库验证DAVID和KOBAS3.0数据库分析的结果。从TCGA数据库下载HCC患者信息,应用“Survminer”R包分析每个核心基因与肝癌患者预后的关系,并分析核心基因mRNA表达量在不同临床特征中的表达差异。
结果:从GSE45267、GSE60502和GSE74656中分别筛选出7583、2349和553个DEGs。经“RRA”方法聚合分析后筛选出221个“聚合DEGs”,主要富集在109条GO通路和29条KEGG通路。其中细胞周期阶段(Cellcycle phase,adj.pval=5.57E-14)、有丝分裂细胞周期(Mitotic cell cycle,adj.pval=1.45E-13)、细胞分裂(Cell division,adj.pval=2.62E-13)、核分裂(Nuclear division,adj.pval=2.76E-13)、有丝分裂(Mitosis,adj.pval=2.76E-13)是最显著的GO通路。代谢途径(Metabolic pathways,p-value=8.71E-12)、细胞周期(Cell cycle,p-value=1.48E-10)、化学致癌性(Chemical carcinogenesis,p-value=5.45E-09)、视黄醇新陈代谢(Retinol metabolism,p-value=1.18E-08)、脂肪酸降解(Fatty acid degradation,p-value=1.36E-08)是主要的KEGG通路。PPI分析结果筛选出9个核心基因(TOP2A、NDC80、CDK1、CCNB1、KIF11、BUB1、CCNB2、CCNA2和TTK),生存分析显示它们都与HCC患者的预后相关,p值分别为0.0042(TOP2A)、0.0012(NDC80)、0.0012(CDK1)、0.00024(CCNB1)、0.00044(KIF11)、0.00015(BUB1)、0.049(CCNB2)、0.0065(CCNA2)和0.0016(TTK)。9个核心基因的mRNA表达量在不同的年龄、种族、组织学类型、病理学分期、肿瘤复发情况和生存状态中分布存在显著差异(p<0.05),在不同的性别和Child-Pugh分级中的分布无明显差异。
结论:本研究鉴别出,TOP2A、NDC80、CDK1、CCNB1、KIF11、BUB1、CCNB2、CCNA2和TTK为HCC的核心基因。这些核心基因参与细胞周期、有丝分裂等多种重要生物学途径,可能是HCC的潜在的生物标志物和HCC治疗的靶点。