穷举折叠序列路径模型和保守mRNA发夹结构

来源 :云南大学 | 被引量 : 0次 | 上传用户:chsmfzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着RNA分子越来越多种类和功能的发现,人们对RNA的理解正在逐步发生变化,开始以一种全新的观念重新认识RNA分子在生物体内所起的重要作用。但一般来讲,这种重新认识的焦点主要集中在所谓的功能RNA分子。这类非编码RNA分子要实现其多样化的功能,必须要形成复杂的三维结构。 相比之下,有关mRNA折叠的研究还很有限。造成这种状况的一个主要原因是,mRNA在体内总是与多种蛋白质紧密地结合成复合体,裸露的mRNA很容易降解,使得mRNA的提取、纯化和结晶在目前的实验条件和实验水平下很难完成。迄今为止,除极有限的mRNA折叠结构元素——发夹被报道,还没有任何一个全长的成熟mRNA的三维结构被测定。此外,已有的实验结果表明,mRNA的折叠结构在体内是确实存在的,并且这种折叠结构在与蛋白质和其他的RNA分子的相互作用中可能起着重要作用。因此,人们一直试图通过理论方法预测RNA结构。目前直接针对RNA三级结构的理论预测,进展都不是很顺利,是当前结构预测的难点所在。然而,针对RNA二级结构预测的方法经过30多年的发展,已渐渐趋向成熟。但是,不管采用何种算法的预测软件,针对给定的一个mRNA核苷酸序列,最终仅仅给出一个孤立的二级结构。无法就此判断预测结构的可信度。 为了对mRNA的折叠过程进行更为合理的仿真模拟,本文从理论分析的角度,对成熟的mRNA序列基于穷举折叠序列路径的思想,采用RNAstructure软件预测其结构,若一个发夹,只要在含有其序列的任意一种路径中都能稳定存在,就称为“保守mRNA发夹结构”(CmRNAhs)。 本文对两个样本(1AA6和1LCF)的核苷酸序列,采用了“-3(3+3)”序列取样法,来穷举折叠序列路径。具体做法是对一条mRNA样本的全长序列,先每次从5去掉3个核苷酸得到一系列SS,并以它们所含的核苷酸数来标识。而后对每个SS,以从3个核苷酸(1-3nt)起始,每次增加3个(1-6,1-9,1-12,……)直到每个SS的全序列长度,一一进行折叠。接着计算了折叠结构中每个发夹在含有其序列的所有SS中每一个SS,这个发夹的核苷酸序列形成发夹的频率(F)。对“CmRNAhs”的判定,采用了“0.9+0.9”,即:此发夹在所有具有此段序列的SS中,其F∈[0.9,1]的个数占具有此段序列的SS总数的90%或以上。此外,对于F值绝大部分处于[0.9,1]和[0.6,0.9)之间的发夹,称为“振荡发夹”。除这两类以外的发夹,统称为“其它发夹”。 分析结果表明,“CmRNAhs”比“振荡发夹”和“其它发夹”在统计学上具有更高的可信度,更接近于体内真实存在的发夹;此外,“CmRNAhs”与“振荡发夹”和“其它发夹”相比是低能量的、稳定的发夹。本文推测,“CmRNAhs”可能影响到mRNA在翻译过程的解链,以及与核糖体的相互作用和与tRNA的识别和定位,并由此对基因表达的翻译调控产生重要作用影响。 此外,通过将“CmRNAhs”和“振荡发夹”的序列截取一段插入随机序列中,来测试发夹序列形成发夹的实验。得知“CmRNAhs”和“振荡发夹”所表现的发夹的稳定性,不仅与此段发夹的序列有关,而且也受到相邻序列(即邻近相互作用),甚至远程序列的影响,但以发夹序列自身的特性占主导地位。 最后,通过对1AA6核苷酸的1-999nt做单点突变,得到2997个突变序列,根据密码子表中的简并度,将这2997个突变序列分为三类:含有终止密码子的序列(STOP);不包括STOP的非同义突变的序列(NOT);同义突变的序列(SYNO)。接着预测其二级结构,然后计算每类的平均结构(平均结构即在每类序列中,某个位点出现频率最高的结构)。通过分析三类发夹及所有突变序列(2997个)的平均结构,发现其平均结构完全相同,但频率值有差异。然后将平均结构中的发夹按照穷举折叠序列路径模型中发夹的类型进行分析发现,除“小于8”的发夹,因使用模型的缺陷无法了解其性质外;其余三类,“CmRNAhs”保守度最高,近乎100%;其次保守的是“振荡发夹”;而“其它发夹”的保守度最低。
其他文献
大型互联电力系统是我国电力工业现代化发展的主要特征,其在提高电力系统可靠性和经济性的同时也大大增加了事故连锁反应造成大面积停电的危险。经验表明,对电力系统紧急控制缺乏应有的重视是引发电力系统灾难性事故的主要原因。而随着风能等可再生能源比例的不断增加,电力系统稳定运行所面临的压力不断增大,亟待开展紧急控制方面的相关研究,因此,本文针对大规模风电接入后的电力系统频率紧急控制措施进行了深入研究。本文首先
  电网是支撑国民经济快速发展的重要生命线工程,架空输电线路则是电网的重要组成部分,负责电能的传输、调节和分配。通常作用在输电线路中的外部荷载包括风荷载、地震荷载、
随着人们对环境的重视程度的提高,可再生能源的应用越来越受到人们的关注,而风力发电作为其中应用技术最为成熟的发电方式之一,被大范围的普及开来。但是,风力发电面临着很多严峻
二恶英类化学物质是环境中存在的最严重持久性有机污染物之一,由于其强毒性、来源广泛、难以降解并在生物链中富集等特点,需要对环境中二恶英进行监测。传统的气质联用化学检测
  现在环境污染严重,空气中污染物增多,电网中的输电线路在暴露在空气中,其中绝缘子污秽在潮湿多雨雪情况下易引发线路故障,严重时会影响电力系统的稳定运行。   为解决绝缘
风能是发展最快最具有规模化开发潜力的新能源,但是由于风力发电的随机性、波动性和不可预测性给电力系统带来了大量不确定因素,大规模风电并网将进一步凸显这些不确定因素对系
动物脂肪酸合酶(FAS,E.C.2.1.3.85)是合成长链脂肪酸、参与体内能量代谢的一种重要的酶。近期的研究表明,FAS是治疗肥胖症和癌症潜在的双重靶点。然而目前已见报道的FAS抑制剂
学位
进入新世纪以来,为了发挥分布式能源的效益,协调分布式电源与大电网之间的配合问题,微电网成为研究热点。微电网为解决全球所面临的能源危机和环境恶化这两大问题提供了有效的途径。而微电网优化调度理论作为微电网的核心技术之一,为微电网的发展和推广奠定了坚实的基础,因而具有重要的理论价值和工程价值。本文所做的主要工作如下:(1)本文建立了微电网系统并网和孤网运行的多目标优化调度模型。考虑以下三个目标函数:微电
肿瘤的发生及转移是一个多步骤、多基因参与的过程。近年来肿瘤分子生物学的研究集中在调控肿瘤发生及转移表型的相关基因的研究,以期为肿瘤的诊断和治疗提供理论依据。很多研
本研究检测了与乳糖代谢相关的MCM6基因多态位点rs4988235(C/T)和与钙吸收相关的TRPV6基因三个多态位点rs4987657(C/T)、rs4987667(G/A)、rs4987682(C/T)在中国汉族人群中的