论文部分内容阅读
目前,全球气候变暖和人口增长等因素日趋严重,土壤盐碱化也越来越严重,成为全世界公认的农业和生态问题。盐胁迫是世界农业生产中的最主要也是最常见的非生物胁迫,是目前影响植物生长发育和农作物产量的主要非生物因素之一。东北地区是我国典型的盐碱地分布区域,因此在东北地区研究植物的盐胁迫具有重要的实际意义。基因组学的出现使植物抗盐研究进入了一个全新的时代,由单基因的研究转向了基因组层面对大量基因结构和功能的系统研究,识别了大量的抗盐基因。近年来,随着高通量测序技术和生物信息学的不断发展,人们逐渐认识到植物的盐胁迫分子机制往往与多基因的相互作用有关,因此如何从海量的大数据中高效准确地识别植物的盐胁迫相关分子标志物及其调控关系是目前面临的一大挑战。本课题以植物研究中模式生物拟南芥作为研究对象,以系统生物学为核心思想,利用结合生物学知识的数据挖掘方法,识别拟南芥盐胁迫相关的风险因子(基因、GO功能节点、KEGG通路、网络模块)。首先,本课题对GEO数据库中下载的五套基因芯片数据进行转录组分析,识别了盐胁迫相关的差异表达基因。并利用先验的生物功能数据库(GO数据库和KEGG数据库)信息及基因集合富集分析方法,运用AgriGO和WebGestalt在线分析工具将差异表达基因进行生物学功能注释,识别出拟南芥盐胁迫相关的GO功能节点和KEGG通路。考虑到微效基因的影响,我们开发了基于微效基因的通路识别策略,并应用于GSE46205数据中,识别出三个显著富集的通路。最后,发现Plant hormone signal transduction、MAPK signaling pathway-plant、Spliceosome、Ribosome biogenesis in eukaryotes和Circadian rhythm-plant这五个通路可能与盐胁迫有关,其中前三个通路在文献中已有证据表明它们与盐胁迫的相关性。这些通路与盐胁迫的靶向关系需要未来的实验研究和理论研究进一步证实。此外,结合蛋白质互作网络和已有数据库信息来识别盐胁迫相关的基因。首先,将胁迫应答的转录因子数据库STIFDB2中的41个拟南芥盐胁迫相关基因作为种子基因,采用重启型随机游走方法识别蛋白质互作网络中与种子基因相似度高的基因作为候选风险基因预测,最后列出了排秩在前10位的基因。这些基因中发现AT3G03000和AT3G62870两个基因在GSE46205中是差异表达基因,这也说明这种方法的有效性。其次,建立了五套数据识别的差异表达基因互作网络,利用MCODE算法识别出6个网络模块,将模块进行通路注释,注释到Ribosome和Ribosome biogenesis in eukaryotes两个生物学通路,这再一次表明Ribosome biogenesis in eukaryotes可能与盐胁迫相关。我们还利用CytoHubba中的MCC算法筛选出差异表达互作网络中的10个Hub节点,这10个基因也是后续研究的靶向基因。总之,我们的研究利用系统生物学的方法识别了拟南芥盐胁迫相关的风险基因、GO功能结点及生物学通路,这将为拟南芥的抗盐分子机制的研究和转基因育种提供帮助,同时也为其他植物的抗逆研究提供借鉴。