论文部分内容阅读
真核细胞中蛋白质和DNA相互作用的相关研究对于理解其功能基因组及其调控机制有着重要的意义。工业丝状真菌米曲霉的基因组中已预测有570个转录因子编码基因,在现阶段只有大约5%的转录因子通过传统的方法被鉴定,大部分转录因子未见报导,并且对米曲霉转录因子在基因组上结合位点的信息及其调控机制知之甚少。本论文将传统的DNase足迹法与新一代高通量测序技术结合(DNase-seq),在全基因组水平研究米曲霉的蛋白质和DNA相互作用模式,解析基因组上的不同类型转录因子结合位点及其调控机制。本文的研究结果主要由以下几个方面组成:(1)利用DNase-seq技术在基因组水平鉴定DNase足迹位点基于传统的DNase I足迹法构建米曲霉不同生理状态下DNase I酶切测序文库,荧光定量PCR方法验证酶切文库质量,结合高通量测序技术与生物信息工具分析获得丰富营养和内质网压力诱导培养条件下高通量的基因组DNase-seq数据,在基因组水平上分析获得160M和100M的酶切位点信息。基于上述全基因组DNase I酶切图谱和搜寻DNase足迹位点的算法,在FDR<0.1的标准下,分别在米曲霉基因组水平上获得8125个和8894个DNase足迹位点,为进一步基于DNase I足迹位点研究全基因组水平转录因子结合位点打下基础。(2)从头预测DNase足迹内的转录因子结合位点基于全基因组DNase足迹位点从头预测不同类型转录因子结合位点,采用生物信息学工具MEME分析和鉴定的两种生理状态下12个和11个转录因子DNA结合基序。在这些转录因子结合基序中发现其中一些与已知转录因子结合位点对应,包括Slt A,Cpc A的基序和b HLH家族的E-box位点。其中发现米曲霉转录因子Slt A有两种共定位的结合模式,这两种模式调控着不同功能的基因表达,暗示着同一转录因子可以通过与DNA的不同结合模式下行使不同功能基因调节的新机制。(3)丰富营养条件下米曲霉的转录组分析为了下一步研究转录起始位点周围染色质结构与基因转录的关系,论文采用链特异性转录组技术对米曲霉基因转录起始位点进行更加精确的重注释。链特异性转录组测序总共获得26,287,168条90 bp长度的reads,根据这些数据分析了营养丰富培养条件下全基因组水平基因的表达量,重新注释了5050个基因的转录起始位点。与基础营养条件相比,一些和有机物分解代谢相关的基因在营养丰富生长条件下发生转录表达上调的现象。(4)转录起始位点附近的DNase I酶切模式和足迹位点分布基于DNase-seq数据库与重新注释的5050个基因转录起始位点,研究转录起始位点周围染色质结构与基因转录的关系。转录起始位点上下游1000 bp的酶切图谱显示转录起始区域按照-1位核小体,无核小体区,转录起始位点和+1位核小体的排列模式。通过对5050个基因转录起始位点的酶切模式进行非监督聚类分析,发现四组具有独立DNase I酶切模式特征的基因,每组基因在相应的基因表达水平和5’UTR长度的分布上存在显著差异。并且发现了转录起始位点周围区域的DNase足迹位点集中分布在基因转录起始位点上游-140 bp长度内的无核小体区域。本研究阐明了转录因子起始位点周围染色质结构和基因表达之间的关联。(5)鉴定基因组上已知转录因子的活性结合位点及两者之间的结构特征基于19个曲霉属中已知的转录因子DNA结合基序和五个转录因子家族在真菌中公布的蛋白质晶体结构数据,分析转录因子DNA结合基序和相邻序列在正负链上的链特异性DNase I酶切数据,发现19个曲霉属已知转录因子基序内外的链特异性DNase I酶切模式在正负链上存在不平衡性。基于五个转录因子家族蛋白晶体结构与其链特异性DNase酶切数据比对分析,显示DNA结合基序正负链上的不平衡性来自于转录因子上氨基酸位点和碱基之间的作用造成的。此结果为蛋白质和DNA在细胞体内的相互作用研究提供有力的证据。