论文部分内容阅读
随着蛋白质免疫共沉淀和基因芯片等实验方法的应用,人们得到了大量的关于酵母细胞中的基因调控数据。人类基因组计划除了对人类进行全基因组测序外,还对其他一些模式生物的全基因组进行了测序,这使得我们拥有酵母基因组中基因的碱基序列以及基因启动子序列,从而可以研究转录因子在DNA序列上的结合位点信息。通过对酵母基因组中6200个基因在上千种实验条件下的表达情况进行分析,可得到基因的表达与实验条件的相关性信息,把基因组的全部基因按不同的转录因子对它们的调控状况进行分类,可得到与实验条件相关的转录因子。对于原始数据的处理就是基于这一想法。
本文以压力响应为例,对各类数据作了上述分析,分别采用了Kolmogrov-Smirnov(KS检验)和ANOVA(方差分析)的方法,由此得到了与压力响应相关的转录因子以及在各类压力下具有协同作用的转录因子对。
基于这两个方法所得结果,本文进一步作了一些分析。针对预测出来的与压力响应相关的转录因子,本文研究了这些压力响应的转录因子之间相互调控关系的子网络,以及在相应压力下这些转录因子的表达水平之间,转录因子与其所调控的基因的表达水平之间,还有转录因子所调控的基因与基因的表达水平之间的相关性。对于上述统计方法预测出来的在各类压力下具有协同作用的转录因子对,本文研究了有协同作用的一对转录因子共同调控的基因的集合中和非共同调控的基因的集合中的基因与基因在表达水平上的相关性的分布,另外还研究了有协同作用的一对转录因子各自的bindingmotif在全基因组中基因的启动子区域中共同出现的情况以及两个motif出现位置之间的距离呈现出来的特征。