论文部分内容阅读
现代人群中存在着大量受达尔文正选择作用的基因,这些基因调控区的进化特点将会为人类进化、各种疾病机理等研究提供重要线索。调控序列的加速进化可以改变靶基因的表达类型,在人类特异性表性进化过程中起到重要作用,但是对调控序列的研究要比蛋白编码区困难。DNA酶Ⅰ超敏感位点(DNase I hypersensitive sites,DHSs)被认为是调控序列的标记物。当前,已发现的所有顺式作用元件(增强子、启动子、绝缘子、沉默子以及基因座位控制区)都与DHSs相偶联。目前利用DHS-seq芯片技术在复杂的基因组中寻找基因调控序列已经被证明是一个非常成功且可验证的方法,已广泛应用于研究,因此大量的DHSs数据正在不断产出,DHSs图谱的构建也已经被纳入ENCODE计划与人类表观基因组计划。此研究中,我们结合DHSs数据库与功能基因组学数据库,使用生物信息学方法,分析了人类大脑发育相关基因调控区内DHSs的分布,并对其进行进化选择分析,推断这些DHSs在进化上的意义,之后对进化上显著加速或保守的DHSs进行功能分析。得出的结果如下:(1)通过GO term获取243个与大脑发育相关的基因,结合DHSs数据库在这些基因的调控区鉴定到184,113 DHSs,经过限制和筛选,最终3,538个DHSs可以进行进化分析。通过假定DHSs的当地古代重复序列(AREs)是处于中性进化的,有2,425个DHSs是加速进化的(aceDHSs)。此研究发现,人类脑部发育相关基因调控区受到比全基因组其他区域更强的正选择选择压力,这是进化过程中造成人与其他非人灵长类动物大脑发育及表型差异的重要原因之一。(2)在人类脑部发育相关基因调控区鉴定到2,425个aceDHSs多处于非编码区(基因间区和内含子区域),编码区(外显子区域)上的aceDHSs数量比显著少于背景DHS s的比例。说明基因编码区在进化上相对比较保守,aceDHSs对非编码区(内含子区域)的调控是大脑的发育及物种的进化的助力之一。(3)aceDHSs调控的靶基因大部分在脑组织中有较高的表达量,有38个靶基因在Biological process功能中富集与大脑发育等于大脑相关的GO条目中。表明aceDHSs对大脑发育起到了一定的调节作用。(4)在大脑发育相关基因调控区的DHSs中鉴定出48个人类特有的转录因子结合位点,大多数转录因子参与到大脑、神经系统的发育中,并且与多种大脑疾病有关,如USF1、USF2、SP1、MNX1、FOXQ1、RREB1、KLF5等。(5)根据全基因组关联研究数据库,在大脑发育相关基因调控区的DHSs内找到108个与疾病相关的SNP,并且推断SNP可能通过影响DHSs来作用于致病基因。为大脑发育相关基因调控区内的疾病相关性结构变异研究提供了新的视野。