论文部分内容阅读
蛋白质-RNA相互作用在生命活动中发挥着至关重要的作用,复合物分子间相互作用影响着生物体中基因的活动、蛋白质功能的实现等。从现在的研究进展看,通过实验结晶的方法获得蛋白质-RNA复合物晶体结构具有一定的困难且效率低下,用计算机模拟生物分子对接技术成为蛋白质-RNA复合物分子间相互作用探究的一种重要补充手段,相对于实验的方法可操作性有所提高。构建一个有效可行的对接打分函数是解决这一问题的关键步骤。一个好的打分函数能够将蛋白质-RNA分子体系中的近天然结构从数量较多的备选结构中同错误结构区分出来,并且具有准确性高、效率高的特点。然而,这样的高效且准确性高的针对蛋白质-RNA复合物的打分函数并没有得到很好的发展。 复杂网络的方法已经逐步成为研究生物大分子和蛋白质-蛋白质复合物的结构-功能关系的有力工具之一。目前大量的理论研究发现,小世界性同样存在于蛋白质的氨基酸网络中,即蛋白质氨基酸网络具有大的聚集系数,同时具有小的网络特征路径长度。在这一基础上,笔者曾利用相关的网络参量来帮助区分蛋白质-蛋白质分子对接中产生的正确与错误构象,得到了比较好的效果。基于这一点,将复杂网络的方法应用于蛋白质-RNA复合物分子对接打分的研究中。这里需要指出的是,笔者针对蛋白质-RNA复合物的结构特点,将氨基酸-核苷酸成对偏好加入到网络之中,构造了加权的复杂网络。通过统计分析复合物界面残基的度的加和值以及网络的特征路径长度,得到蛋白质-RNA复合物分子近天然构象与错误构象在网络性质中的差异。对于蛋白质-RNA复合物复杂网络的研究,一方面有助于理解生物大分子结构-功能的关系,另一方面有利于对蛋白质-RNA分子特异性识别机理的研究。这可以为复合物分子结构的预测、辅助新型药物研发,以及生物分子间相互作用机理的研究打下基础,开拓新的方向。 本论文中包含两部分工作: (1)蛋白质-RNA复合物组合打分函数的研究 目的是准确高效地从众多备选结构中区分出近天然结构以及错误结构。为了构建一个这样的打分函数,并使之运用在蛋白质-RNA复合物结构的准确性预测当中,笔者以之前提出的考虑了蛋白质和RNA二级结构的氨基酸-核苷酸统计成对偏好势为基础,对该成对偏好势、物理能量项(包括蛋白质-RNA分子相互作用中的静电能以及范德华能)进行综合考虑,从而构建了一个新的组合打分函数。打分函数中打分项各有权重,其权重通过SPSS软件线性拟合打分与配体均方根偏差的方法得到。为了验证该打分函数的打分效果,对27个非冗余蛋白质-RNA体系进行了unbound对接以测试笔者的组合打分函数的打分筛选效果。测试结果表明,新的组合打分函数的筛选能力优于打分函数DARS-RNP、QUASI-RNP以及仅考虑氨基酸-核苷酸统计成对偏好势时的筛选能力。 (2)蛋白质-RNA复合物分子复杂网络的研究 以蛋白质-RNA分子对接结构为研究对象,构建了复合物的氨基酸-核苷酸的复杂网络模型。在加入了氨基酸-核苷酸成对偏好后,通过计算上述来自27个蛋白质-RNA分子对接的结构的界面残基度的加和值以及网络的特征路径长度,统计分析了近天然构象与错误构象之间的性质差异,发现网络参量也可以初步用于区分该类复合物对接的近天然结构与错误结构。