论文部分内容阅读
通过分析癌症的基因组,研究者发现在癌组织中存在着大量基因突变。其中一部分发生基因编码区且引发了错义突变,预示这些基因的翻译产物将出现突变的蛋白质序列。蛋白质是基因功能的执行者,它的序列突变可能导致功能发生变化并进一步造成组织的病理变化。一般认为,突变蛋白质的检测将有助于改善癌症诊断及治疗。事实上,识别突变蛋白质的抗体已经应用于癌症的病理判断及用药指导,例如KRAS∶G12D、BRAF∶V600E等。然而,这类抗体的开发与应用还相当有限,主要是由于所发现的癌症相关突变蛋白质的数量有限,而且识别突变蛋白质的抗体制备仍存在较大的技术挑战。本课题以结直肠癌相关的突变蛋白质为研究对象,通过对结直肠癌多组学数据的比较与分析,筛选高频突变的突变基因及其表达产物,制备能够识别含有突变位点肽段的单克隆抗体,并验证这些抗体在肽段偶联产物、重组蛋白质、细胞、组织等不同水平上的辨识特异性和敏感度。 美国国立癌症研究院的TCGA计划完成了224例结直肠癌病患的基因组分析、698例这类患者的转录组检测,同时也对这些病患群中95例样本进行了蛋白质组测定。对这些组学数据整合,发现有一部分突变基因能够转录成mRNA或翻译成蛋白质。但是由于质谱检测方法的局限性,蛋白质水平上的突变位点鉴定率相当低下。试图首先从转录组数据着手,寻找高频的突变基因表达产物。通过GATK和Samtools两个算法的互交分析,在转录组共鉴定了13411个转录的突变基因,其中含有122879个错义突变位点。进一步对转录的突变基因分布概率分析,发现:1)从基因组到转录组的基因突变传递率仅为12.07%,大量的基因突变只在一个水平上被检测到;2)结直肠癌相关的突变位点检测频率在各组学水平上呈现同一趋势,即只有相当少数的突变位点具有较高检测频率;3)即便对于高检测频率的基因,它们在不同表达水平上表现是不一致的。 为了筛选对应于突变基因的mRNA或蛋白质,引入Peptide Atlas数据库,并设定严格的筛选原则:1)候选物初筛:选择那些在基因组上突变频率在0.5%以上的错义突变,在转录组上20%以上的位点,在蛋白质组上5%以上的突变蛋白质;2)突变肽段筛选:将所有初筛的侯选物进行Peptide Atlas数据库搜索,选取具有肽段鉴定证据的突变基因或mRNA或蛋白质作为下一步筛选的候选物;3)确定突变肽段作为研究靶标:考察突变基因的表达产物是否参与癌症相关通路、是否曾鉴定为结直肠癌生物标志物、是否为药物治疗的靶基因。基于上述原则,共筛选了25个结直肠癌相关突变肽段为候选物。 对这25个突变肽段进行了抗原表位预测,分析了抗原表位区肽段的同源性以及细胞定位,模拟了突变位点在完整蛋白质上的几何位置,最终选择了20个适合制备单克隆抗体的突变肽段候选物。采用化学合成法生成突变肽段以及相对应的野生肽段,并且在合成肽段的N端或C端加入供偶联用的半胱氨酸残基。将合成肽段与血蓝蛋白偶联,偶联产物作为免疫原注射入小鼠,再经过增强免疫、细胞融合、ELISA检测、细胞株筛选等步骤,最终制备成功了针对13个突变肽段的单克隆抗体。 采用免疫检测方法,从四个方面评价所制备的单克隆抗体:1)是否识别肽段与牛血清白蛋白偶联产物;2)是否识别含有突变位点的重组蛋白质;3)是否识别肿瘤细胞系中的抗原;4)是否识别结直肠癌组织样本。通过系统的评估,发现,7个抗体能够有效地辨别突变或野生的肽段,而其他6个抗体无法区分这两类肽段。制备了7个含有突变位点或野生位点的重组蛋白质作为进一步筛选的抗原。测试表明,只有四个抗体能够区分突变或野生的重组蛋白质,分别为PPP2R1A∶R183W、CTNNB1∶W383G、ATP2A2∶I150N、CDK12∶R890H。用这些抗体在肿瘤细胞蛋白质提取物和肿瘤组织切片上做了测试:HDGF∶P201L能识别HT29细胞中的蛋白质,CTNNB1∶W383G能识别HCT116中的蛋白质,但在组织中的识别方式明显不同于野生型;HDGF∶P201L能识别结直肠癌组织中肿瘤细胞胞质的蛋白质;CDK12∶R890H识别癌症组织中高分化的肿瘤细胞的胞质和胞核;SERPINA1∶E400D识别组织中炎症细胞胞质和胞膜以及淋巴细胞的胞质。尽管这些单克隆抗体的系统评价尚未结束,上述数据清楚揭示,肿瘤基因组数据库为发掘结直肠癌相关突变蛋白质创造了前提;依据数据库制备的一些单克隆抗体已初步具备了结直肠癌的病理检测的潜质。