论文部分内容阅读
蛋白质磷酸化是生物体内最重要的一种翻译后修饰,磷酸化反应是由蛋白激酶将ATP上的磷酸基团转移到底物特定氨基酸上完成的。磷酸化是一种可逆的共价修饰,其逆过程被称为去磷酸化反应,由蛋白质磷酸酶催化完成。蛋白质磷酸化是生物体内重要的调控方式,几乎参与了所有的生物学过程,异常的磷酸化过程通常与疾病癌症的发生发展密切相关。近些年来,多种组学技术的发展为磷酸化与疾病的研究提供了海量的数据资源,如何从这些数据中挖掘学习有价值的信息成为该领域内研究的关键。本文从激酶-底物磷酸化网络层面,对磷酸化修饰和疾病的关系开展了相关生物信息学研究。蛋白激酶是介导可逆磷酸化反应的重要因子,对激酶的深入了解是研究磷酸化修饰的基础。为此,我们对真核生物中激酶的分类注释开展了系统的研究。利用文献阅读及数据库整合,我们搜集了实验验证的1,855个蛋白激酶,通过对已有分类信息的整合,规范和统一,我们将激酶分类到10个组,149个家族。我们进一步采用Profile HMM结合直系同源搜索的方法,对84个真核生物进行了系统的鉴定,最终得到50,433个蛋白激酶。我们构建了在线数据库EKPD,并且对每个蛋白进行了详细的注释。此外,我们对真核生物中蛋白磷酸酶也进行了鉴定分类并添加到数据库中。迄今为止,EKPD是包含物种最多,注释最为全面的真核生物激酶和磷酸酶数据库。在激酶分类注释的基础上,对激酶功能的研究是深入了解磷酸化的关键。最近研究表明,异常的自噬可能与一系列神经退行性疾病的形成密切相关。在本工作中,我们采用定量磷酸化组学技术,结合计算方法,分析了两种天然神经保护性自噬增强药物Cory及Cory B对磷酸化网络的影响。我们开发了一个新的基于磷酸化网络的激酶活性分析方法iKAP,预测并验证了 RPS6KB1,及MAP2K2激酶活性受到Cory的显著影响。我们还发现,敲除MAP2K2或PLK1均会显著抑制自噬过程,且Cory诱导的神经细胞中β-淀粉样蛋白蛋白及α-突触核蛋白蛋白的清除作用也受到显著抑制。因此,我们的研究表明了 iKAP算法对研究疾病中磷酸化的有效性,同时,也首次揭示了 MAP2K2及PLK1在神经保护性自噬系统中发挥着重要的作用。生物体内大部分复杂疾病来源于多种基因蛋白的共同作用,从磷酸化网络中分析潜在的关键磷酸化信号往往比发现单个磷酸化底物或位点更加有效。遗传变异通常与疾病密切相关,而人们目前对遗传变异驱动疾病发生发展的机制尚不清楚。为此,我们结合遗传变异和磷酸化修饰,通过模拟重构遗传变异影响的磷酸化网络,对磷酸化信号以及疾病癌症的关系进行了研究。首先,我们结合iGPS算法,获得9,606个影响磷酸化的nsSNPs(PhosSNPs),并构建了 PhosSNPs相关激酶-底物磷酸化网络。我们发现该网络受到PhosSNPs的显著影响,且显著富集疾病癌症基因及相关信号通路。通过分析人群特异性的激酶-底物磷酸化网络,我们发现了一些疾病癌症相关基因受到PhosSNPs的不同的调控。进一步,通过对癌症中体细胞突变,基因扩增以及酪氨酸信号通路的研究,我们观察到包含PhosSNPs的癌症基因更倾向于和其他变异共同出现,且显著富集在酪氨酸激酶或底物中。因此,我们的研究揭示了PhosSNPs可以对磷酸化产生重要的影响,它可能通过改变磷酸化网络影响疾病易感性,与其他变异共同驱动疾病癌症的发生发展。随着磷酸化组学数据的增加,如何精确的预测磷酸化网络中激酶底物调控关系成为疾病研究中的关键。在本工作中,我们在已有研究的基础上,改进并开发了激酶特异性磷酸化位点预测软件GPS 3.0。通过文献阅读,我们搜集了 7,426个磷酸化位点,并将肽段长度选择,权重突变引入训练模型中,我们扩展了激酶预测能力,并且添加了物种特异性及双特异性激酶预测。通过和现有工具的比较,GPS 3.0展现出更加优越的预测性能。最后,我们提供了本地和在线可视化预测工具。综上所述,本工作基于激酶-底物磷酸化网络建模的方法,对蛋白质磷酸化和疾病关系进行了系统的分析,阐述了遗传变异可以通过改变磷酸化影响疾病,同时也揭示了激酶活性分析对寻找药物靶标具有潜在的意义,为未来深入研究磷酸化调控机制,开展个性化医疗提供了支持。