论文部分内容阅读
真核生物细胞的组织多样性以及基因结构都比原核生物复杂,但是与原核生物一样,真核生物中转录水平的调控也是遗传信息传递和表达的基础,是基因表达调控机制发挥作用的重要环节。启动子承载着基因表达最核心的调控信息,它决定着基因的转录起始、转录频率及何时何地如何表达。而启动子序列作为基因表达所必需的序列信号和基因转录水平上的重要调控元件,深入研究其结构和功能是揭示基因转录调控机制和表达模式的关键。前期研究结果表明,酵母转录频率高的基因启动子中有较多的有利于基因转录的调控元件;而转录频率低的基因启动子中则缺乏这类元件。这些结果提示,转录频率高的基因启动子与转录频率低的启动子序列结构可能存在差异,但迄今为止,对这种差异性还缺乏全面系统地认识。本文的主要目的是找出酵母中转录频率高与转录频率低的基因启动子序列结构的差异,并对序列结构差异随转录频率的升高所呈现的变化趋势进行统计分析。
首先,我们分别定义转录频率大于50mRNAs/hr和小于2.5mRNAs/hr的基因为高转录基因和低转录基因,并基于似然比检验和卡方检验提取出高转录和低转录基因启动子序列中显著不同的模体.对照基于Markov链方法构建的Z—score统计量识别出的两组启动子中过表达和低表达的模体,结果发现,不仅高转录和低转录的基因启动子序列中过表达和低表达的模体与实验得到的转录因子结合位点匹配率均达到95%以上,而且提取出的显著不同的模体大部分都是高转录启动子序列中过表达或低表达的模体。我们推测这些显著不同的模体可能是酵母基因上游中影响基因转录频率的序列信号。
其次,按照一定的标准将1198条酵母基因启动子序列进行分组,以转录频率最低的一组为对照组,分别基于Markov链模型和模体出现频率从相似性和差异性两个方面来度量随着转录频率的升高各组启动子与对照组结构差异的变化趋势,并进行相关分析。结果表明,虽然都出现了扰动点,但随着转录频率的升高,各组启动子与对照组启动子序列结构差异逐渐增大。相关分析的结果显示Markov链方法比频率方法可以更好地刻画序列结构特征。这些结果将有助于我们对酵母基因启动子序列结构及其转录调控机制的认识。