基于生物信息学肝细胞癌关键基因的筛选与ceRNA调控网络的构建

来源 :兰州大学 | 被引量 : 1次 | 上传用户:amincrazy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:(1)通过生物信息学分析方法筛选与肝细胞癌(hepatocellular carcinoma,HCC)发生和发展相关的关键基因及信号通路,并预测其生物学功能;(2)通过对TCGA数据库mRNA,miRNA和lncRNA基因表达数据谱及临床数据的挖掘,构建HCC的ceRNA调控网络,寻找与HCC发病、进展及生存相关的mRNA,miRNA和lncRNA,探讨可能的分子机制。方法:(1)从NCBI GEO数据库下载HCC芯片数据GSE54236、基因探针及平台信息,整理并处理原始数据后利用R语言的“limma”包筛选差异基因(differential expression genes,DGEs),设定阈值为(logFC≥2且P<0.05)。通过“gplot”程序包中的“heatmap.2”函数绘制HCC样本与正常样本的聚类热图和火山图;利用STRING 10.5数据库构建PPI网络,筛选节点数最多的前30个基因作为候选基因;采用GO本体分析、KEGG分析对DGEs进行生物学功能和通路富集的探索;(2)从TCGA数据库的GDC上下载HCC转录组的Manifest数据、Metadata数据和Counts数据,通过“Perl”语言处理为表达矩阵,在Ensembel网站上下载Homo_sapiens.GRCh38.84.chr.gtf.gz文件,利用“Perl”语言脚本将原始基因表达矩阵的“Ensembl ID”转换为“gene symbol”表达矩阵,再利用R语言“edge R”包从mRNA表达谱中提取lncRNA,获得mRNA和lncRNA表达谱矩阵,同法获得miRNA的表达矩阵。再利用R语言的“edge R”包分别提取三种RNA的DGEs,设置阈值为(|log FC|>2.0且P<0.01)进行差异分析。分别将差异lncRNA与miRcode数据库作比对,再通过miRTarBase、TargetScan和miRDB三个数据库进行miRNA靶基因的比对后得到miRNA的靶基因,由此获得差异lncRNA-差异miRNA与差异miRNA-差异mRNA的关系对,导入至Cytoscape软件,构建ceRNA调控网络图;(3)整理三种RNA差异基因的生存数据,通过R语言的“Survival”包及Kaplan-Meier Plotter分析软件进行差异基因的生存分析,绘制三种RNA差异基因的生存曲线,获取关键基因。结果:(1)共筛选出675个HCC的差异基因,其中上调233个,下调442个。PPI网络图中CDK1,NDC80,BUB1,NCAPG,CCNB1,BUB1B,TPX2,TTK,NEK2,CCNA2,CDC6,CENPA,CDCA8,CCNB2,MAD2L1,AURKB,AURKA,CENPF,BIRC5,CENPE,CHEK1,KIF2C,CDC25C,CDT1,HJURP,NUF2,NCAPH,MCM10,CENPM,SPC25为节点数最多的前30个蛋白,构成该网络的中心,与其它蛋白共同形成相互作用的网络,可作为候选基因。GO分析显示差异基因的功能涉及细胞周期调节、细胞周期检查点、有丝分裂细胞周期检查点、细胞粘附、有丝分裂、急性炎症反应、化学刺激应答、细胞外区域等生物学过程、分子功能及细胞组成。KEGG通路富集分析显示差异基因主要富集在12条关键信号通路上:化学性致癌通路、视黄醇代谢通路、外源化合物的细胞色素P450代谢通路、药物的细胞色素P450代谢通路、细胞周期通路、酪氨酸代谢通路、类固醇激素生物合成通路、脂肪酸降解通路、PPAR信号通路、花生四烯酸代谢通路、矿物质吸收通路、色氨酸代谢通路;(2)由TCGA数据库下载得到424个转录组(正常组50个,HCC组374个),425个miRNA文件(正常组50个,HCC组375个),经筛选HCC组织与正常组织间共有1987个mRNA差异基因(其中上调1781个,下调206个),miRNA差异基因126个(其中上调123个,下调3个),lncRNA差异基因1070个(其中上调1013个,下调57个)。将差异lncRNA与差异miRNA进行比对得到75个lncRNA,16个miRNA,差异mRNA和miRNA的靶基因取交集得到36个mRNA。构建lncRNA-miRNA-mRNA调控关系对3个,符合ceRNA理论的调控通路共1条:CCDC26-hsa-mir-141-EPHA2;(3)基因CBX2,CCNB1,CCNE1,CCNE2,CDC25A,CEP55,CLSPN,E2F1,E2F7,RRM2,SHCBP1,HOXC8,KIF23,SOX11的高表达组生存率低于低表达组,可作为HCC不良预后的生物标志物;CPEB3,PROK2,TSPEAR-AS1低表达组生存率低于高表达组,可能是HCC的保护性基因。结论:(1)PPAR信号通路是新发现的一条与HCC发生、发展有关的关键信号通路,有望为HCC的治疗开辟新途径;(2)“CCDC26-hsa-mir-141-EPHA2”ceRNA调控通路可能参与了HCC的发病机制,其分子机制尚需实验进一步验证;(3)发现14个mRNA可作为HCC不良预后的生物标志物,2个mRNA和1个lncRNA可能是HCC的保护性基因。
其他文献
新时期,官兵的思想多元、多样、多变,只有紧盯官兵思想的时代特征,做到以活抓活、用活治活,抓住官兵思想“活鱼”才能切实让思想政治工作奔着活思想去。一要激活主体。教育是
期刊
中国共产党在从中国革命到局部执政、从局部执政到全国执政,从善于革命到善于执政的历史实践中得出了“三个执政”的科学结论,这对于我党长期执政具有重大意义。坚持“三个执政
马克思主义政党存在和发展的根本条件是建设并不断实现党的先进性。中国共产党自成立以来,之所以能够由小到大从弱变强,成为中国革命事业和中国社会主义现代化事业的领导核心
超临界循环流化床锅炉具有超临界蒸汽循环发电效率高以及循环流化床低成本洁净燃烧的综合优势,受到人们的重视。本文提出了26.17MPa、604oC、一次再热800MWe 超临界燃煤循环
目的探讨吸烟、饮酒与乳腺增生症的关系。方法应用病例对照研究方法,采用χ2检验和秩和检验进行分析。结果定性分析表明病例组吸烟/被动吸烟和饮酒的比例高于对照组,两组差异
通过国内外大量膛炸事故的破坏状况与膛炸原因的统计分析,本文将膛炸模式归纳为五种类型:(1)装药设计不当引起火药破碎;(2)冲击载荷引起弹内炸药引爆;(3)引信失灵引起弹内炸
采用水热法合成铝镁水滑石,并通过X射线衍射(XRD)、红外光谱(FT—IR)、透射电镜(TEM)、热分析(DSC)、粒度分析等手段对合成的水滑石进行表征,研究高温水热法和低温超声辅助法合成的水滑
服务质量是民航运输业竞争力的重要内容,也是行业竞争优势的重要来源。针对推动民航运输服务质量改进的关键影响因素,以及我国民航运输服务质量持续改进中存在的问题,应通过
党的十六届四中全会提出,党要做到科学执政、民主执政和依法执政,这是加强党的执政能力建设的一个重要内容.要保证党做到科学执政、民主执政和依法执政,就必须实现党的执政方