论文部分内容阅读
地下鼠通常在地下缺氧环境中仍保持正常活动。作为我国特有地下鼠,实验室条件下甘肃鼢鼠(Eospalax cansus)能够在4%氧气浓度下存活10小时以上且无明显损伤,而SD大鼠(Sprague-Dawley rats)同样条件下仅存活不到6个小时,显示甘肃鼢鼠具有良好的低氧适应性。为探索甘肃鼢鼠的低氧适应机制,我们对暴露于多个氧气浓度(6.5%6h,10.5%44h,21%一周)的甘肃鼢鼠多个组织(心、脑、肝、骨骼肌)进行转录组分析。同时,我们也对常氧条件下的肺和胰脏进行了转录组测序。通过对全部转录组进行组装,同时参考盲鼹鼠(Spalax galili)基因组注释基因集,我们共获得18037个基因,包含73835条转录本序列。基因的长度主要分布范围为201~4600 nt,平均长度为3097 nt。大部分基因包含2~6条转录本,平均含有4.09条转录本。与其他多个基因组已发布的物种基因序列比对发现,盲鼹鼠基因序列与甘肃鼢鼠大部分基因序列(>84%)具有最佳同源性(Blast得分最高)。通过将基因序列比对至多个数据库如Nr、GO、Swiss-Prot、Pfam、KEGG,共有17911条基因序列被至少一个数据库注释。对基因序列的CDS进行预测,共获得17760条CDS序列(长度阈值>100 aa),其中70.8%(12578条)CDS具有完整开放阅读框(具起始密码子和终止密码子)。对基因表达水平进行分析,发现共有17663条基因具有可观察的表达水平(至少在一个样品中表达水平超过1FPKM),脑组织表达的基因数目最多,共有10209个基因在所有六个器官组织中均产生表达,主要涉及基础生物功能。我们共识别了3002个组织特异表达基因,其中脑组织表达最多的组织特异基因,心脏表达最少的组织特异基因,而肝组织特异基因中高表达基因的比例最高,各组织特异表达基因富集的功能与相应组织发挥的基本功能相一致。此外我们识别了2872个基因能够在不同组织中偏好表达不同的转录本,这可能有助于组织特定功能的实现。四个组织的不同氧浓度处理比较中共发现了4594个差异表达基因(DEGs),其中在心肌组织发现的DEGs最多(2027),脑组织最少(1019),大部分DEGs(3469)只在单个组织中发现。通过GO富集发现,脑组织DEGs主要集中于免疫、刺激响应、代谢等。肝脏中发现的DEGs主要与肝脏内代谢过程相关,如固醇代谢、脂代谢、细胞酮代谢过程等。心肌组织中出现的DEGs主要跟响应和调控相关,如损伤响应、刺激响应、抵抗响应、细胞迁移调控、细胞增殖调控等。骨骼肌中DEGs富集的GO条目主要集中在发育、调控、响应等方面,如细胞迁移调控、器官发育、胁迫响应调控、激素刺激响应等。同时我们发现了多个包含GO条目为“低氧响应”的DEGs,这些基因可能在有关组织低氧响应及适应中起关键作用。对DEG进行KEGG富集发现,脑组织中富集的通路主要有Jak-STAT信号通路、TNF信号通路、Hippo信号通路等。心肌组织DEGs富集的通路主要有补体途径、HIF-1信号通路、钙离子信号通路等。骨骼肌DEGs富集的通路有PI3K-Art信号通路、细胞外基质受体互作、蛋白质消化和吸收等通路。肝组织DEGs富集的通路有PPAR、AMPK、胆固醇代谢、胆汁分泌等。通过分析低氧条件下与能量代谢相关的重要基因表达模式,我们推测甘肃鼢鼠肝脏在低氧条件下脂肪酸氧化和糖异生增加,而蛋白质合成和脂肪酸合成可能减少。此外在低氧条件下发现抗凋亡或抗氧化基因的表达上调可能有助于甘肃鼢鼠对低氧的适应。我们对肝组织中六个重要DEGs进行了q PCR实验验证。有关研究发现,长非编码RNAs(lnc RNAs)在基因表达调控中发挥重要作用,一些lnc RNAs在癌症中被发现作为低氧诱导的lnc RNAs。通过分析甘肃鼢鼠转录组数据,我们在肝脏和心脏组织预测了数千个lnc RNAs。与m RNAs相比,这些lnc RNAs通常具有更短的长度、更低的表达水平、更低的GC含量。大部分lnc RNAs在低氧条件下具有表达峰值。我们发现1128个差异表达的lnc RNAs(DE-lnc RNAs)能够响应低氧刺激。为探索lnc RNAs相关的mi RNAs调控网络,我们分别预测了471个DE-lnc RNAs作为潜在的mi RNAs靶标和92个DE-lnc RNAs作为模拟靶标。我们还基于lnc RNA-m RNA共表达网络预测了DE-lnc RNAs的功能。DE-lnc RNAs主要参与了生物调控、信号传导、发育、酮酸代谢过程、脂质代谢/生物合成、催化活性等功能。作为首次在甘肃鼢鼠中的lnc RNAs研究,我们的研究结果表明,lnc RNAs广泛存在于甘肃鼢鼠转录组中,并参与低氧响应相关的多个生物过程。最后,为方便用户使用我们构建的流程进行lnc RNAs识别及并进行基于lnc RNA-m RNA共表达和基于ce RNAs假说(lnc RNA-mi RNA-m RNA调控网络)预测lnc RNAs功能,我们开发了lnc RNAs识别和功能预测工具并上传至Git Hub供用户下载使用。