论文部分内容阅读
有关物种进化的分子机制一直是分子系统学研究的核心,在前基因组时代,蛋白质的系统发育主导了整个分子生物学的研究,而在后基因组时代,有关RNA和非编码区序列的结构调控研究成为最前沿的分子进化的研究主题。我们有必要改变以前通行的将蛋白质与RNA分子的系统分析统一研究或等同分析的作法,将编码区与非编码区的进化从两个不同的生命起源的水平分开来研究,从而在一个更加全面的角度来探讨分子生物学与宏观进化的理论统一性。因而从基因组非编码区寻找一个合适的具有生命起源意义的RNA分子标记是首要任务。 RNase P RNA(rnpB)是目前唯一一个属于非编码区的RNA分子标记。rnpB不仅存在于所有生物体细胞的染色体中,而且存在于所有亚细胞组织如线粒体、叶绿体中,是已知的核酶分子中自然代谢效率最高的成份,是整个核酶RNase P的主导分子。在所有生物类群中有关rnpB的多级结构研究揭示了其进化过程中很高的保守性,其核心的保守序列区具备了特异的生物分类功能,是一个具备了生命起源意义的强大的分子标记。作为第一个识别的能够独立行使代谢职能的RNA分子,有关rnpB的系统分析是关键的,有助于我们深入理解在生物进化过程中RNA分子担当的角色。不同生物界之间rnpB分子的不同代谢特点与它们所承担的核心结构调节功能有可能通过这个RNA分子携带的遗传信息来体现,并反映不同生物界中的进化分歧,而rnpB的碱基序列具有在相同种群中特异保守的特点,同时其亚细胞组织的序列为我们探寻真核生物的内共生起源提供了分子系统学整体演变研究的可能性,另外目前的有关RNase P的生化性质的体外试验也提供了大量有关的RNA与蛋白质络合过程中的不同代谢模式的分子证据。通过基于rnpB分子的生命树重建不仅揭示了从细菌到动物的全范围种群之间的系统分类关系,而且为更深层次的生命起源与物种演化的细胞内分子机制的研究提供了系统发育的整体分析。另外本文还在分子系统学的一般性分析的基础上,对最后的结论进行了系统发育同源的检验与生化实验的证据分析,而且进行了与其他生物信息学方法论提出的同源性相一致的互相验证。 本研究首先通过已有的晶体结构与二级结构的预测结果相比较,总结出rnpB分子的核心保守区与辅助区交错分布的镶嵌型结构特点;然后将传统的生物信息学中的系统分析模型按照rnpB分子特殊的保守型结构进行了有针对性的改进,并应用于全部样本的生物体的系统发育分析。在具体的系统分析中,将序列比对联配的程序进行了有倾向性的比对参数调整,增加空位的开放罚分到最大化的水平,同时作为一个重要的调节补偿,最大限度地降低了空位的延伸罚分;同时将碱基取代模型增加了参数的动态调节,这样提高了整体比对结果中可用于系统分析的信息位点的内容与数量;并从高级结构排列的角度也进行了一致的全局比对。同时为了从最基本的RNA分子热力学原理的基础上分析细菌、古生菌、真核生物三域rnpB分子的基本信息统计的多次验证,本研究发展了信息熵的算法,改进了常用的碱基组分分析法,并在整体水平上,用直方图和信息熵差异度两种方法进行了比较分析。这些统计结果从全局的信息分子组织性机制的水平揭示了三域的共性与区别,并且作为一个迭代的算法技术来统计rnpB的高级结构在一级碱基序列上的全局映射,尤其是在碱基位点与碱基串序列分布的坐标映射分析。 在上述工作的基础上,本研究进行了最后的结论性分析一生命树重建。通过