论文部分内容阅读
1 研究目的肝脏癌症是全球数量第六多的癌症且致死人数位列第四位。在中国,肝脏癌症发病率位列第四位,因肝脏癌症死亡的病人数量在中国国内排在第二的位置,这都是由其非常高的恶性程度导致的。足以见得肝脏癌症对于国民健康水平具有极大的危害。在过去的几十年里,全基因组分子分析在快速检测参与肿瘤发生和发展的差异表达基因方面发挥了关键作用,并被证明是识别核心基因的可靠技术,在本研究中,我们的目的是通过生物信息学分析,找出与肝脏癌症发生和发展具有关联的分子生物学的标志物,为今后肝脏癌症的个体化治疗提供一定的分子机制。2实验方法首先在GEO数据库搜集并下载mRNA数据集GSE14520、GSE29721、GSE84402,使用R语言对数据进行整齐化处理并鉴定肝癌组织和癌旁组织之间的差异表达基因(DEGs),并通过火山图将三个数据集的DEGs表达情况反映出来,使用Venn图对三个数据集取交集。然后利用R语言取交集得到的DEGs进行GO分析和KEGG分析。通过STRING数据库建立DEGs之间的蛋白-蛋白相互作用网络PPI(protein-protein interaction)并且通过软件Cytoscape将PPI网络进行可视化处理,同时用其软件插件CytoHubba对PPI网络进行模块分析,筛选出关键候选基因,进一步通过使用BiNGO插件,进行核心DEGs生物过程的GO分析。通过UCSC Cancer Genomics Browser数据平台,对关键基因进行聚类分析,以热图的形式进行表达差异的分析。将关键候选基因用survExpress在线分析有生存意义的关键基因以及用GEPIA在线分析这些关键基因的表达量。使用的ualcan数据库,对核心基因进行甲基化表达分析。在细胞功能实验中,通过siRNA对核心基因CDK1进行敲降,利用CCK8实验进行细胞功能的验证。3结果对GSE14520,GSE29721和GSE84402三个数据集筛选后的数据进行交集分析,得到交集DEGs103个。通过R语言的ClusterProfiler包对103个DEGs施行GO分析和KEGG分析。GO生物功能富集分析发现,DEGs主要参与辅酶结合、酸胺结合、氧化还原酶的活性、作用于配对供体、掺入或还原分子氧等;KEGG通路富集分析发现DEGs主要参与流体切应力与动脉粥样硬化、多发性特发性出血性肉瘤相关疱疹病毒感染、TNF信号通路、乙肝信号通路等。通过分析PPI网络鉴定出与肝癌生存密切相关的10个关键基因(CCNB2、AURKA、CDK1、UBE2C、BUB1B、TOP2A、RACGAP1、NUSAP1、ASPM、PRC1)。通过 GEPIA 数据库,评估10个核心基因的表达情况,采用Kaplan-Meier图对肝细胞癌患者进行预后情况的分析,包括肝细胞癌患者临床数据中的总体生存率(Overall survival,OS)和无病生存率(Disease free survival,RFS)分析。在GEPIA数据库中,分别进行10个核心基因的预后分析,发现在无病生存率方面,10个基因均具有统计学意义,且均为基因的表达水平越高,无病生存情况越差,反之生存情况越好;在总体生存率方面,8个基因具有统计学意义,分别为AURKA、CDK1、BUB1B、TOP2A、RACGAP1、NUSAP1、ASPM和PRC1,它们呈现出一种基因表达上调和较坏的总体生存状况有关联,反之与较优的总体生存状况有关联。对十个关键基因在癌和癌旁组织中进行表达水平高低的分析,使用在线TCGA可视化工具GEPIA数据库进行分析发现,CCNB2、AURKA、CDK1、UBE2C、BUB 1B、TOP2A、RACGAP1、NUSAP1、ASPM和PRC1十个关键基因的表达在肝脏癌症患者的癌组织中明显高于其癌旁组织,且都具有统计学意义。通过ualcan数据库对以上关键基因在癌中的甲基化程度高低进行了研究,发现CCNB2、CDK1、PRC1、TOP2A、UBE2C五个基因的甲基化程度在肝脏癌症患者中表现出在肝癌组织中低于其癌旁组织中的表达,五个基因在肝细胞癌中可能是通过甲基化程度的差异表达调控了基因的差异表达。CCK8实验发现,利用siRNA敲减CDK1后肝细胞癌细胞系Hccl-M3和Hep3B的增殖能力出现显著下降。4结论本研究通过对mRNA芯片分析鉴定得到的特征性基因可以预测肝癌的预后以及指导肝癌的治疗靶标。