论文部分内容阅读
生物学家们对同义密码子使用偏性问题的研究一贯都是非常关注的。Grantham以及其他学者在很早就发现了密码子的偏性具有物种差异性的特点,以及发现具有相同偏好的不同表达基因。随着生物科学技术的迅速成长,许多的密码子使用偏性研究材料均来自于大规模的各种基因组数据。很多的研究者在探索同义密码子使用偏性的进化原因和规律时,他们的研究数据大多数都是来自于几个或者几百个乃至成千个的基因组。在我们的工作中,发现mRNA二级结构和蛋白质折叠速率均可能与密码子偏性有重要的联系,所以分别建立了mRNA二级结构以及蛋白质折叠数据库,试图探索同义密码子使用偏性对mRNA二级结构及其相应蛋白质折叠速率的影响。第一,本文收集了45种冠状病毒的mRNA序列信息和大肠杆菌的核蛋白信息。首先对于每个病毒,计算了每一个蛋白mRNA序列的同义密码子使用度,逐一预测了每条mRNA序列所对应的RNA二级结构,并计算了mRNA茎、环结构含量,单位平均折叠自由能以及相应的mRNA柔性四种参量。建立了一个具有对应mRNA信息、的二级结构参量数据库,然后对于大肠杆菌,按二级结构从每条核蛋白中截取出α螺旋、p折叠以及无规卷曲三种类型片段,找出与每个肽链片段相对应的核酸序列,计算序列的同义密码子使用度以及相应肽链片段折叠速率建立了一个蛋白质折叠数据库。第二,以我们建立的mRNA二级结构数据库为基础,分别将每条mRNA序列的同义密码子使用度与这四种参量之间的相关性进行详细分析。分析结果显示,与mRNA茎结构含量显著相关的密码子所涉及氨基酸的种类达到总数的90%;与mRNA环结构含量显著相关的密码子所涉及氨基酸的种类达到总数的75%;与单位平均折叠自由能显著相关的密码子所涉及氨基酸的种类达到总数的90%;与mRNA柔性显著相关的密码子所涉及氨基酸的种类达到总数的85%。进一步还发现,同时与茎结构含量和环结构含量都显著相关的密码子,它们的相关性截然相反,而且柔性与同义密码子使用度的相关性呈现出更好的结果。由此可以表明,冠状病毒同义密码子使用偏性和mRNA二级结构存在很大联系。第三,在建立数据库的条件下,详细地分析了三种不同类型肽链片段的折叠速率和同义密码子使用度的关联。发现对于三种类型二级结构的片段,每种类型都有部分肽链片段的折叠速率和密码子使用度有着显著的相关性。结果显示,同义密码子使用度在蛋白质折叠中起着重要作用。