基于Poisson分布和Markov链模型的基因启动子序列结构特征分析

来源 :云南大学 | 被引量 : 0次 | 上传用户:ff927
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真核生物细胞的组织多样性以及基因结构都比原核生物复杂,但是与原核生物一样,真核生物中转录水平的调控也是遗传信息传递和表达的基础,是基因表达调控机制发挥作用的重要环节。启动子承载着基因表达最核心的调控信息,它决定着基因的转录起始、转录频率及何时何地如何表达。而启动子序列作为基因表达所必需的序列信号和基因转录水平上的重要调控元件,深入研究其结构和功能是揭示基因转录调控机制和表达模式的关键。前期研究结果表明,酵母转录频率高的基因启动子中有较多的有利于基因转录的调控元件;而转录频率低的基因启动子中则缺乏这类元件。这些结果提示,转录频率高的基因启动子与转录频率低的启动子序列结构可能存在差异,但迄今为止,对这种差异性还缺乏全面系统地认识。本文的主要目的是找出酵母中转录频率高与转录频率低的基因启动子序列结构的差异,并对序列结构差异随转录频率的升高所呈现的变化趋势进行统计分析。   首先,我们分别定义转录频率大于50mRNAs/hr和小于2.5mRNAs/hr的基因为高转录基因和低转录基因,并基于似然比检验和卡方检验提取出高转录和低转录基因启动子序列中显著不同的模体.对照基于Markov链方法构建的Z—score统计量识别出的两组启动子中过表达和低表达的模体,结果发现,不仅高转录和低转录的基因启动子序列中过表达和低表达的模体与实验得到的转录因子结合位点匹配率均达到95%以上,而且提取出的显著不同的模体大部分都是高转录启动子序列中过表达或低表达的模体。我们推测这些显著不同的模体可能是酵母基因上游中影响基因转录频率的序列信号。   其次,按照一定的标准将1198条酵母基因启动子序列进行分组,以转录频率最低的一组为对照组,分别基于Markov链模型和模体出现频率从相似性和差异性两个方面来度量随着转录频率的升高各组启动子与对照组结构差异的变化趋势,并进行相关分析。结果表明,虽然都出现了扰动点,但随着转录频率的升高,各组启动子与对照组启动子序列结构差异逐渐增大。相关分析的结果显示Markov链方法比频率方法可以更好地刻画序列结构特征。这些结果将有助于我们对酵母基因启动子序列结构及其转录调控机制的认识。
其他文献
最近五十年来,奇异多个体系统的理论与用途的研究一直不竭吸引着国内外很多学者的关注目光,并且取得了非常多的有价值的研究成果,同时伴随着研究的进一步深入,人们逐渐发现许多实
培养符合新媒体时代要求的人才,是新闻教育工作者目前面临的一个重要课题。文章从新闻传播类的核心课程——新闻采访与写作着手,以三亚学院为例,认为课前新闻播报、校内实训
作为动力学的基础,微分方程的定性性质受到越来越多的关注,近年来,分数阶微分方程的研究成为热点.分数阶微分方程定性性质的研究也产生了一系列成果,其中,分数阶微分方程与差
广义系统提出于20世纪70年代,1974年,Rosenbrok H.H在研究复杂电路网络系统时首先提出了广义系统这一概念。广义系统存在于许多领域,比如工程领域、社会领域、经济领域等。此
Markowitz开创了现代投资组合理论,他提出组合的目标在于保证预期收益率的前提下把风险降到最小,或者在限制一定风险的前提下使收益率达到最大,从而得到证券组合的有效边界,再根
学位
元胞自动机可以看成为一类无穷维离散的动力系统,它们具有空间、时间和状态都离散的特点。元胞自动机是一种理想化数学模型,可以被用来模拟许多物理、生物和化学等复杂现象。 
支持向量机(Support Vector Machine SVM)是目前公认的广泛使用的模式识别和机器学习方法,它基于支持向量决定的核函数的线性组合做出预测。SVM在各方面有着广泛的应用,然而SVM有
案例一:2011-2014届,我班有一名叫李敬缘的男生,中考英语成绩72分,总分排名班上倒数第三,每次英语测试七八十分左右,而且该生对英语很不感兴趣,甚至有点厌恶的情绪,一上英语
期刊
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
本文定义了左o—幺半群和右o—幺半群及o—幺半群,从这些幺半群出发,定义了格林o—关系,并且研究了与格林o—关系有关的半群.其主要结果如下: 1.详细的定义了格林o—关系,并指出