论文部分内容阅读
蛋白质是生命大厦的基石,其活性区域的自动检测对于预测蛋白质与蛋白质之间的相互作用、蛋白质识别、药物设计等起着重要作用。研究可靠有效的蛋白质活性位点自动检测方法,是当代生命科学和相关学科的共同目标。目前,来自于生物、化学、计算机、数学等领域的科学家们从蛋白质的几何结构和其它各种角度出发,借助于信息科学、生物信息学、计算生物学、计算化学等手段,对这个问题进行研究。
蛋白质的活性位点不但与其三维几何结构密切相关,还与蛋白质分子体系的多种作用力和体系能量的势能场的共同作用(即分子场)密切相关。此外,蛋白质只有在运动过程中才能体现其功能,因此本文分别从蛋白质分子的几何、静态分子场和动态分子场这几个方面出发,充分运用几何、图论、拓扑学和信息学等学科的方法对它们进行研究,以揭示蛋白质活性位点的预测及其局部变构等问题,主要包括:
·提出一种基于图论的蛋白质一蛋白质对接预测方法。蛋白质的活性位点通常位于蛋白质分子表面的凹腔区域[1],我们首先根据Q形理论检测蛋白质分子表面的显著凹腔区域,然后运用图论中的极大团理论来搜索两个蛋白质在凹腔区域是否存在最佳几何匹配,进而预测它们的对接。
·提出一种快速检测静态分子场的拓扑变化关键值和关键区域的自动算法。Betti数是刻画流形曲面拓扑性质的拓扑不变量,我们提出一种快速计算流形曲面Betti数的算法,利用它来自动检测分子场等值面的拓扑发生改变的关键值,为从分子场角度检测蛋白质的活性区域提供了新思路。
·提出一种检测蛋白质分子场在动态变化过程中整体性质发生改变的关键时刻的计算方法。我们借助球面调和分析这一工具,提取蛋白质分子场在动态变化过程中每一帧数据的频谱特征,通过比较这些频谱来判断动态分子场发生整体性质变化的关键时刻,为预测蛋白质在生化过程中发生变构的时刻提供了新的分析工具。
·提出一种寻找蛋白质在动态生化反应过程中发生局部变构的区域的方法。首先计算出蛋白质分子的动态多属性分子场,然后将每一帧多属性分子场划分为互不相交的子区域,以信息论为基础计算每一个子区域上场数据的信息重要程度。通过分析每一个局部区域的多属性分子场信息重要程度随时间变化的趋势曲线,对这些子区域在生化反应过程中是否属于变构区域、在什么时候发生变构做出预测。
我们选取了几个具有典型生化意义的蛋白质体系对上述算法进行验证,预测结果与实际结果相吻合,表明本文提出的方法对于研究蛋白质—蛋白质相互作用和蛋白质识别等关键问题具有重要的价值。