论文部分内容阅读
蛋白质是生命活动的物质基础,生命活动中各种生理功能的完成大多是通过蛋白质来实现的。蛋白质多种多样的功能与其特定的空间构象密切相关,蛋白质分子的空间构象是其功能活性的基础,构象发生变化,其功能活性也随之改变。蛋白质相互作用过程中,其三维空间结构和能量场均发生动态变化。但已有工作对前者的变化研究比较多,而对后者的变化研究较少。如果能对后者定量计算,发掘蛋白质相互作用的本质规律,将有利于预测蛋白质功能。
蛋白质分子体系中的各种相互作用,包括化学键力、氢键力、静电力、范德华力等,在空间中叠加会形成的一个综合性作用的分子场。传统的基于分子力学的方法依赖于分子力场信息,很多参数是根据实验数据设定的,每一种参数化的力场对应着一种分子力学方法,所以针对某类分子优化的力场只有在应用于同类分子时才可保证得到可信的结果。分子力学方法是在原子核相互作用的基础上完成计算,无法处理分子体系中的电子运动,因而不能描述键形成或键断裂的过程,无法很好地解释蛋白质相互作用过程中的极化效应。
量子化学计算应用分子轨道理论,获得分子体系的电子波函数,进而求算偶极矩、极化率等分子性质。第一原理计算方法只使用几个物理常数:光速,电子和核的电荷,质量和普郎克常数,而不使用基本物理常数和原子量以外的实验数据,所有计算都建立在量子力学原理上。相比较而言,量子化学方法直接求解薛定谔方程,能得到更为准确、可靠的结果。
本文提出了一种基于量子化学的蛋白质分子场计算方法,结合线性标度理论,将Hartree-Fock方法运用于计算蛋白质三维空间能量分布。该方法具有通用性,输入仅为单个或多个蛋白质的构象信息,无需设置其他参数。计算得到的分子场数据可以直接体绘制显示出来,便于交互操作。该方法可以有效地处理电荷运动细节和极化效应,也不受蛋白质体系大小的限制。
利用量子化学方法处理蛋白质分子体系的最大困难在于需要大量的计算资源,其计算时间往往令人难以忍受。本文提出搭建异构集群系统,构造分布式计算环境,以获得高性能计算能力和海量数据处理能力来加速计算蛋白质分子场。利用GPU较强的浮点运算能力和较大的内存带宽,通过改进算法让GPU和多核CPU协同计算,使得计算效率提高了几十倍以上。
蛋白质相互作用过程中,关键区域能量分布会随着构象发生显著变化。定量计算蛋白质分子场的变化,对研究相互作用热点区域有着重要意义。本文通过模拟胰岛素样生长因子连接蛋白IGFBP4(insulin-like growth factor binding protein-4)与胰岛素样生长因子IGF(insulin-like growth factor)、IGFBP7(insulin-like growth factor bindingprotein-7)和胰岛素insulin的相互作用,计算了蛋白质分子场的动态变化。结果表明,分子场变化趋势明显的氨基酸残基片段恰好对应于蛋白质相互作用的热点区域,与已知实验结果相符。考察蛋白质相互作用过程中分子场的动态连续变化,为研究蛋白质结构和功能关系提供了一种的新方法。