论文部分内容阅读
生物信息学是综合数学,统计,计算机等方法来处理生物数据,解决生物问题的学科。结构生物信息学侧重于对生物大分子结构的研究。本论文研究了结构生物信息学中的活性中心结构比对方法在蛋白质结构功能关系研究中的应用。我们系统的分析比较了具有相同或相近功能的酶的催化活性中心,获得关于催化机理的新假设,并通过量子化学计算进行验证,或者提供酶-抑制剂结合特异性与活性中心结构的关联规律,帮助更高专一性的抑制剂的设计。具体地,我们选择了两类酶,分别作为研究对象:一类是(β/α[)8折叠类型(又叫TIM-barrel fold,根据磷酸丙糖异构酶triosephosphate isomerase命名)的糖苷水解酶(Glycoside Hydrolases,GH),另一类是人类蛋白激酶。TIM桶折叠类型是蛋白质中最古老的折叠类型之一,此类蛋白成员之间,即使序列相似性非常低,折叠的结构却很相似。TIM折叠类型的蛋白质覆盖了多种完全不同的蛋白质家族,可以催化多种毫无关联的反应。这种一个折叠类型多个功能的特别情况使得我们对TIM折叠类型的蛋白很感兴趣,对它的活性中心的研究显得至关重要。TIM桶折叠类型的蛋白中,有三分之一都是糖苷水解酶。糖苷水解酶广泛存在于几乎所有生物体内,参与各种糖原的合成和降解。一些特定糖苷水解酶的缺乏或变异会导致一系列的发育障碍乃至死亡。对糖苷水解酶催化机理的研究源远流长。从1953年Koshland提出基本的反应机理开始,随着后续蛋白质结构测定方法的成熟,越来越多的糖苷水解酶结构出现,大量点突变实验酶动力学实验及计算机模拟为大规模系统的研究糖苷水解酶机理提供了可能。我们比对了130个亲源关系较远,但是催化作用相似的TIM桶折叠类型糖苷水解酶的活性中心。这些糖苷水解酶主要采用了两种催化机理。一是经典的构象保持型反应机理,另一种是底物参与催化的构象保持型反应机理。这两种机理均需要一个氨基酸作为广义酸碱参与反应过程。基于多活性中心比对信息,这些糖苷水解酶的活性中心可以被归至六大类。而其中与广义酸碱相互作用的氢键可能对催化起了重要作用。从头计算的结果表明,这些保守残基与广义酸碱的作用可以降低17-20kcal/mol的反应能垒,说明这些保守的相互作用是化学上非常重要的,而这种降低能垒的现象主要是由于质子从广义酸转移到离去基团发生在亲核攻击过渡态之前。此外,在两类底物参与反应的活性中心中,底物亲核基团与一个趋同进化而来的酪氨酸形成保守的相互作用。这个相互作用对反应能垒似乎没有起到降低作用,但是它在另一方面降低了反应熵,对催化同样起到了不可或缺的作用。另一类是人类蛋白激酶(human protein kinase),我们通过对比所有结构可用的人类蛋白激酶的活性中心,找出在保守的口袋中高度分化的氨基酸位点,并结合了激酶与抑制剂的结合信息,计算了激酶高度分化的位点与抑制剂结合情况的互信息,找出了不同激酶选择性结合不同抑制剂的相关氨基酸位点,最后通过机器学习的方法,对抑制剂与激酶结合情况进行了反预测,验证了这些位点的重要性。此外,我们还将结构生物信息学的方法扩展到药物重利用的领域。一款新药,从研发到上市,是一个非常耗时耗力的过程。而一些已经批准上市的药物,陆续被发现对非靶标疾病也有一定疗效。已经批准上市的药物,是已经通过各种体外体内实验及临床检验被证明是安全的药物,如果能对这些药物开发出新的用途,将大大省时省力。在此,我们利用结构生物信息学的方法,搜集了所有美国食品药品监督管理局(US Food and Drug Administration,简称FDA)批准上市的药物,对其靶标蛋白与恶性疟疾疾病蛋白做了基于活性中心的结构比对,构建了一个药物-疾病蛋白网络(drugome),相当于一个虚拟高通量筛选。高连接度的药物表示与多个疾病蛋白都有可能有相互作用,可以作为进一步筛选研究的新的抗疟疾药物。