论文部分内容阅读
鸟枪法串联质谱蛋白质鉴定策略由于其高可靠和高效率而被广泛应用于蛋白质组学研究中,这种方法直接将蛋白质混合物进行酶切成复杂的肽段混合物,然后这些肽段混合物通过多维液相色谱进行分离而进入串联质谱进行肽段鉴定,最后再根据鉴定到的肽段推导出可能存在的蛋白质。然而,由于利用质谱图推导肽段存在一定的假阳性率,同时直接对蛋白质混合物的酶切也导致了肽段和蛋白质之间关联信息的丢失,故所鉴定的蛋白质难免存在一些不可靠的结果。尤其是在高等真核生物中,同一个多肽序列可能出现在不同的蛋白质或者蛋白质亚型中,这些共享的多肽将会影响生物样本中真实蛋白质的确定。因此在推断蛋白质的过程中会产生一定的错误和丢失一定的信息。目前绝大部分蛋白质组学研究关注的是蛋白质表达水平的变化,然而蛋白质的翻译后修饰却调节着蛋白质重要的生物学功能,因此全面研究蛋白质的翻译后修饰有利于理解蛋白质复杂多样的生物学功能。目前,在生物体内已经发现了500多种蛋白质的翻译后修饰形式,但相对于整个蛋白质组来说翻译后修饰蛋白质含量较低且具有较高的动态变化范围,所以蛋白质组学的翻译后修饰相关研究也极具挑战性。近几年在蛋白质翻译后修饰的研究中,多数是利用翻译后修饰富集技术对磷酸化和糖基化进行分析。但由于不是每一种翻译后修饰都有相应的富集技术,致使很难利用富集技术大规模的研究蛋白质组学翻译后修饰信息。而在非富集的情况下,常规的质谱鉴定蛋白软件只能搜索少数几个指定可变修饰。随着生物信息学技术的发展,已经出现很多可大规模搜索蛋白质翻译后修饰的软件。Unimod是一个公共的蛋白质翻译后修饰数据库,里面详细全面记载了蛋白质翻译后修饰的形式和位点。以上信息都为不采用翻译后修饰富集技术进行蛋白质组学全面的翻译后修饰研究提供了契机。为了找回传统鸟枪法进行蛋白质组学研究时丢失的信息,本研究从多肽水平结合了更多的翻译后修饰信息比较了两种白血病细胞系(Jurkat和K562细胞系)的蛋白质组学数据。这两个细胞系的蛋白组学数据来自于Mann的实验,没有利用任何的翻译后修饰富集技术,这种非富集的方法与常规的方法相比,不增加任何实验步骤,实验过程简单迅速,唯一区别的是在质谱鉴定之后使用鉴定翻译后修饰的软件PEAKS进行搜索,并通过人工查找去除了非体内翻译后修饰的蛋白质。通过对这两个细胞系蛋白质组学数据的翻译后修饰检索,并在多肽水平进行分析,在这两个细胞系中共同鉴定到了44046个多肽信息。去除了在两个细胞系都鉴定到一张谱图的多肽后,11.43%的多肽在两个细胞系有着不同的翻译后修饰信息,1.73%的多肽都存在翻译后修饰,但相同的肽段有着不同的翻译后修饰形式或者可能不同的位点。这些体内翻译后修饰可能导致蛋白质有着不同的结构和功能,进而调节着蛋白质不同的生理功能,为蛋白疾病标志物的发现奠定了基础。因此,从多肽水平结合多种翻译后修饰信息比较两样本可得到更多的信息。