论文部分内容阅读
泛素-蛋白酶体系统(Ubiquitin-proteasome system,UPS)介导了真核生物8085%的蛋白质降解,该蛋白质降解途径具有ATP依赖、高效、高选择性的特点。泛素化修饰不仅介导蛋白质降解,还参与调控诸多细胞过程,包括细胞周期、细胞凋亡、转录调控、DNA损伤修复及免疫应答等。泛素化修饰的异常与诸多疾病相关联,如癌症和神经退行性疾病。泛素化修饰位点的特异选择性丰富了泛素化修饰的功能,泛素化修饰可以精确、特异地调控生物学过程。对泛素化修饰位点的性质展开系统探索有利于理解泛素化修饰的深层生物学机制及功能。近年来,随着大规模蛋白质组学实验技术的发展,越来越多的泛素化修饰位点数据不断产出,高效地组织、存储、呈现以及分析这些数据显得十分必要。本文对泛素化修饰位点展开了如下生物信息学分析:深入分析了泛素化修饰位点的多种性质,构建了一个高效的泛素化修饰位点预测模型,建立了现阶段规模最大的泛素化修饰位点数据库,开发了一个蛋白质组水平的泛素化修饰位点展示系统UbiSiteXplorer,以及系统分析了泛素化修饰位点的进化事件。我们希望这些生物信息学资源和分析结果可以为泛素化修饰研究领域的科研工作者提供便利,帮助揭示泛素化修饰的深层生物学机制。对于展开泛素化修饰位点的生物信息学分析,最基础的问题是鉴定泛素化修饰位点,为后续研究提供数据基础。然而,传统的实验鉴定方法对时间、资源和人力的消耗较大,而生物信息学方法可以有效地弥补这一缺陷,帮助科研人员绘制蛋白质组水平的泛素化修饰位点草图。现阶段已有的泛素化修饰位点预测工具尚无法提供令人满意的预测表现,为了建立一个高效且效果良好的泛素化修饰位点预测模型,我们结合了两大类生物学特征,蛋白质序列属性和蛋白质序列相似性,其中蛋白质序列属性特征又可细分为五类:氨基酸理化性质、蛋白质固有无序性、蛋白质二级结构、位置特异性打分矩阵(Position-specific scoring matrix,PSSM)及距离为k的氨基酸对构成(Composition of k-spaced amino acid pairs,CKSAAP)。通过性质分析我们发现,相比于非泛素化修饰位点,泛素化修饰位点倾向位于具有更大体积、更高分子量、更高容积可及性、更高疏水性以及结构化程度更高的蛋白区域,这些特征有助于泛素链对修饰位点的识别和结合。使用这六类生物学特征,结合最小冗余最大相关特征选择方法(Minimum redundancy maximum relevance,m RMR),支持向量机(Support vector machine,SVM)及逻辑回归(Logistic regression,LR)机器学习方法,我们建立了一个泛素化修饰位点预测模型。交叉验证及独立测试集验证均显示该模型具有较好的预测效果,通过与现有预测模型展开横向比较,结果显示我们的模型具有最佳的表现。进一步地,我们采用该预测模型对人类泛素化修饰位点展开了蛋白质组水平的预测,对人类全部非冗余蛋白质(Swiss-Prot release 201503)上的赖氨酸位点进行打分,判断每个赖氨酸位点发生泛素化修饰的可能性,并将预测结果与文献挖掘和数据库来源的泛素化修饰位点数据进行整合,建立了现阶段最大的泛素化修饰位点数据库。进而,我们将所建立的泛素化修饰位点预测模型与泛素化修饰位点数据库整合建立了UbiSiteXplorer(a proteome-wide ubiquitination sites explorer for human proteins),这是一个综合的人类泛素化修饰位点在线展示系统,用户可以通过数据库查询浏览文献报道的或者模型预测的泛素化修饰位点数据,返回给用户文献出处或者相应的预测打分及相应的生物学证据支持,对于未在Swiss-Prot收录的蛋白,或者经过突变的蛋白质序列,用户可通过在线调用预测模型进行预测,值得注意的是,该预测模型支持用户定制预测功能,对于用户感兴趣的特定类型的泛素化修饰,如特定泛素链类型的泛素化修饰、特定组织内发生的泛素化修饰,UbiSiteXplorer允许用户上传经过自行质控的金标准数据集,后台自动建立预测模型进行预测,这是首个具有用户定制功能的位点预测平台。UbiSiteXplorer的在线访问网址为:http://prodigy.bprc.ac.cn/ubisitexplorer。探索泛素化修饰位点的进化事件是另一个热点研究方向,有助于揭示泛素化修饰的生物学机制。目前尚没有对泛素化修饰位点进化过程中功能约束条件的研究。现有研究多将全部泛素化修饰位点作为一个整体进行讨论,仅讨论了有限的进化时期及有限的进化阶段的进化保守性。为了对泛素化修饰位点的进化保守性与功能约束之间的关联获得更为全面及精确的认识,我们首先在广泛的进化阶段内分析了泛素化修饰位点的进化保守性,通过将人类泛素化修饰位点与从大肠杆菌到大猩猩同源序列进行比对,我们发现进入脊椎动物分歧时间之后,泛素化修饰位点相比邻近对照位点呈现出更高的进化保守性,而在脊椎动物分歧时间之前,泛素化修饰位点进化速率更高,保守性更低;接下来,通过将泛素化修饰底物蛋白分入不同的功能分组,我们发现在进化过程中,特定的功能约束会影响泛素化修饰位点的进化保守性,比如特定的生物学功能(酶结合,细胞大分子代谢过程,发育过程),蛋白质组织表达特异性及蛋白质在蛋白质相互作用网络中的连接度。最后,通过分析不同进化时期新增的泛素化修饰位点及其功能分布,我们证实了在各个进化时期新增的泛素化修饰位点同样受到这些功能约束的影响。以上结果表明泛素化修饰位点进化过程中受到的功能约束提升了泛素化修饰参与调控细胞和发育过程的机会。