论文部分内容阅读
研究目的:IgA肾病(IgA nephropathy,IgAN)是全球最常见的原发性肾小球肾炎,其发病机制不完全清楚,本研究基于GEO(Gene Expressed Omnibus)数据库对IgA肾病基因芯片进行生物信息学数据分析,探讨IgA肾病的发病机制。研究方法:1、从NCBI的GEO数据库下载基因芯片数据GSE115857、GSE93798、GSE37463,使用R软件的affy、limma等软件包整理并处理原始数据、筛选差异基因(Differentially expressed genes,DEGs),表达差异用差异倍数(fold change,FC)表示,设定阈值为(P<0.05且|logFC|>1)。用R软件的RRA(RobustRankAggreg)包集成三个数据集的差异分析结果。2、用R软件的clusterProfiler包对DEGs进行基因本体论(Gene Ontology,GO)的生物学功能分析和京都基因与基因组百科全书(Kyto Encyclopedia of Genes and Genomes,KEGG)通路富集探索。3、采用STRING在线数据库对所获得的DEGs进行蛋白质-蛋白质相互作用(Protein-protein interaction,PPI)分析,利用 Cytoscape 绘制可视化蛋白质相互作用网络图,利用CytoHubba插件中的12种算法对基因进行排名,选取每种算法排名前10的基因,用R软件的UpSetR包对基因集合可视化,并且筛选出枢纽基因(Hub gene),对枢纽基因进行Pearson相关性分析。4、利用受试者工作特性曲线(Receiver operating characteristic,ROC)分析检验枢纽基因诊断的有效性。5、利用肾病临床数据库(Nephroseq)对枢纽基因进行验证。研究结果:1、在GSE37463数据集中选择来自GPL14663平台的数据,可以筛选出164个DEGs,其中上调基因118个,下调基因46个;在GSE93798数据集中筛选出321个DEGs,其中上调基因97个,下调基因224个;在GSE115857数据集中筛选出296个DEGs,其中上调基因131个,下调基因165个;用RRA算法最后整合出21个DEGs,包括6个上调基因和15个下调基因。2、DEGs GO 富集分析结果:细胞组分(Cellular component,CC):DEGs 在细胞组分上主要富集在转录调控复合物上。生物过程(Biological process,BP):DEGs在生物过程方面主要富集在信号转导和细胞分化上,包括细胞对胞外刺激的反应、DNA转录起始、细胞内受体信号转导、骨骼肌细胞分化、RNA聚合酶Ⅱ正调控pri-miRNA转录条目。分子功能(Molecular function,MF):DEGs在分子功能方面主要富集在转录激活剂活性及结合反应相关的条目,包括DNA结合转录激活剂活性、RNA聚合酶Ⅱ特异性、核受体活性、配体激活的转录因子活性、糖皮质激素受体结合。3、DEGs KEGG通路富集分析结果:DEGs主要富集在大肠癌、利什曼原虫感染、B细胞受体信号通路、MAPK信号通路、Toll样受体信号通路、T细胞受体信号通路、癌症的通路、泛酸和辅酶A生物合成等通路。4、通过STRING在线数据库构建得到蛋白质-蛋白质相互作用网络图,利用Cytoscape软件的CytoHubba插件中的12种算法筛选基因,最后再用R软件的UpSetR包筛选出5个关键枢纽基因:FOS、JUN、NR4A2、NR4A3、EGR3。对枢纽基因进行的Pearson相关性分析可以看出,这5个基因两两之间呈正相关关系。ROC曲线分析这5个基因均有较好的诊断效能。5、枢纽基因的表达和IgAN的相关性通过Nephroseq数据库进行验证,Nephroseq数据库结果显示,与正常肾脏捐献者相比,IgAN患者FOS、JUN、NR4A2、NR4A3、EGR3基因表达下调,该结果与本次得到的关键基因的表达趋势一致。研究结论:1、3个IgA肾病数据集中筛选出共同的差异表达基因21个,其中上调基因6个,下调基因15个。2、FOS、JUN、NR4A2、NR4A3、EGR3这5个基因可能在IgAN发生发展过程中起重要作用。