论文部分内容阅读
目的:通过生物信息学分析的方法,筛选出肝癌组织与正常肝组织之间的差异表达的长链非编码RNA(long non-coding RNA,lncRNA)、微小RNA(microRNA,miRNA)和信使RNA(messenger RNA,mRNA),并分别分析它们与肝癌预后的关系以及三者之间的相关性,构建出与肝癌预后相关的竞争性内源RNA(competing endogenous RNA,ceRNA)网络,为肝癌的预后预测提供有价值的生物学标记物,并为肝癌的药物治疗提供可能的潜在靶点。方法:通过GEO数据库选择GSE84402、GSE87630、GSE101685三组肝癌相关的芯片数据集,通过GEO2R在线分析工具,分别找出肝癌组织与正常肝组织之间的差异基因(Differentially Expressed genes,DEGs),并根据限定的adj.P值及FC值筛选出有意义的差异基因,寻找出三组差异基因的交集,利用在线网站DAVID对上调差异基因行基因本体论(Gene Ontology,GO)富集分析和KEGG(Kyoto Encyclopediaof Genesand Genomes)信号通路分析。利用在线数据库String创建蛋白质相互作用网络(protein-protein interaction,PPI),并借助 网络分析软件 cytoscape 及其插件 Cytohubba 的Degree 算法,最终确定10个关键基因,选取score评分在57及以上的关键基因,利用数据库GEPIA对肝癌组织与正常肝组织之间的关键基因表达差异作进一步验证,并在Kaplan-Meier生存分析数据库中分析其与肝癌预后的关系。在microT、RNA22、miRmap、PITA、TargetScan、PicTar、miRanda七个数据库中预测关键基因上游的miRNA,同样通过Kaplan-Meier分析miRNA与肝癌预后的关系,用Starbase数据库分析miRNA与靶基因之间的关系,从而找出可能靶向调节关键基因的miRNA。随后在miRNet中进一步预测miRNA上游的lncRNA,在StarBase数据库中对其表达进行分析,在Kaplan-Meier中对其与肝癌预后关系进行分析,最后在StarBase数据库中分析lncRNA与mRNA的相关性。结果:1.一共确定了 307个差异表达基因,包括87个上调基因和220个下调基因。2.上调基因的KEGG分析显示其主要富集于细胞周期、DNA复制、卵母细胞减数分裂通路。3.通过String及cytoscape找出10个关键基因,分别为:AURKA、CCNA2、ASPM、AURKB、CCNB2、KIF20A、TOP2A、NCAPG、TPX2、UBE2C。其中score评分在57及以上的基因共7个,分别为:AURKA、CCNA2、ASPM、AURKB、CCNB2、KIF20A、TOP2A。4.进一步验证显示 AURKA、CCNA2、ASPM、AURKB、CCNB2、KIF20A、TOP2A在肝癌组织中较在正常肝组织中明显高表达,并且表达量越高,生存期越短,预后越差。5.在microT、RNA22、miRmap、PITA、TargetScan、PicTar、miRanda七个数据库中共预测出关键基因上游的miRNA共30个,其中有 hsa-miR-130a-3p、hsa-miR-300、hsa-miR-148a-3p、hsa-miR-219a-5p、hsa-miR-144-3p、hsa-miR-543六个miRNA在肝癌组织中表达量越高,预后越好。6.分析miRNA 与 mRNA 相关性提示 hsa-miR-148a-3p 与靶基因 CCNA2、hsa-miR-144-3p 与靶基因 TOP2A 为负相关关系,hsa-miR-130a-3p、hsa-miR-300、hsa-miR-219a-5p 与靶基因CCNA2,hsa-miR-543与靶基因TOP2A为正相关关系。7.根据寻找出的靶向调节mRNA的miRNA进一步预测出上游的75个lncRNA,其中THUMPD3-AS1、LINC01301、DUXAP8、TUG1、SNHG3、SNHG4、HCG18、LINC01006、LINC00346、SNHG20这10个lncRNA在肝癌组织中表达量明显高于正常肝组织,并且其表达量越高,肝癌预后越差。8.THUMPD3-AS1、DUXAP8、TUG1与TOP2A呈正相关关系,LINC01301 与 TOP2A 无明显相关性,SNHG3、SNHG4、HCG18、LINC00346、SNHG20、TUG1与CCNA2呈正相关关系,LINC01006与CCNA2无明显相关性。9.根据以上对于lncRNA、miRNA、mRNA的表达对肝癌预后的影响以及三者相关性之间的分析,构建出了 THUMPD3-AS1/DUXAP8/TUG1-hsa-miR-144-3p-TOP2A以及SNHG3/SNHG4/HCG18/LINC00346/SNHG20/TUG1-hsa-miR-148a-3p-CCNA2 的ceRN A 网络,它们是肝癌的发展以及预后的不利因素。结论:构建出了两条新的ceRNA网络,它们影响着肝癌的发展及预后,可以作为肝癌预后预测的潜在的生物学标志物。