论文部分内容阅读
RNA是生物体内一种扮演着非常重要角色的大分子,要想准确理解其生物学基本功能,必须要知道RNA精确的结构。因此RNA的二级结构和三级结构成为了当前生物学领域的重要研究方向之一。尽管目前我们对于RNA的二级结构的研究比较透彻,但是RNA三级结构的实验解析受到了很大的限制,因为RNA分子体外结晶困难和实验技术条件的限制。这使得从理论上通过计算手段来预测RNA分子的三级结构越来越受到重视。计算手段通过设计一个有效的算法来进行构想空间的搜索和设计一个合理的打分函数来区分天然态和候选结构。当前已经有一些RNA三级结构预测方法,例如3d RNA、RNA2D3D、FARNA/FARFAR、MC-Fold/MC-Sym、i Fold RNA、NAST等。但是这些方法对于结构复杂或大的RNA分子的建模还是相当困难的,特别是对于具有多分支环的三级结构的预测,因为多分支环中的空间分布通常取决于非标准碱基配对以及碱基堆积相互作用。除此之外目前对于用来区分天然态和候选结构的打分函数的研究很少,基本上都是关于原子距离、二面角的基于知识的能量函数,例如3d RNAScore和RASP。针对以上提出的问题和RNA很强的静电效应,本文研究了将RNA分子溶液里面的静电能作为一个打分指标来设计区分天然态和候选结构的能量函数的可能性。为此我们设计了两个基于不同标准的能量函数,分别是基于库伦休克尔德拜势的打分函数Elec_DH和基于Delphi的打分函数Elec_Delphi。发现静电并不适合单独作为打分指标来设计能量函数,于是设计了关于原子距离、二面角和静电的组合评分函数,对于randstr测试集而言,组合评分函数相比于3d RNAScore打分函数,有13个RNA的打分精度提高,但相应的有7个RNA的打分精度降低。为了帮助提高RNA三级结构预测的准确性,本文还统计分析了目前实验已经测出的三分支环的空间结构,利用当前几种主流的机器学习算法,包括神经网络、支持向量机(SVM)、K最近邻、贝叶斯、回归、决策树和随机森林,对三分支环螺旋与螺旋之间三个角度的预测、三分支环同轴螺旋堆积效应预测和三分支环家族拓扑结构分布进行了预测。这为准确的构建多分支环打下了基础。