论文部分内容阅读
可变剪接作为真核生物基因组中普遍存在的基因调控机制,与生物体的生长发育以及多种疾病的发生都有着密切关系。在漫长的物种演化过程中,可变剪接以外显子为基本单位不断进化,其进化结果表现为可变剪接外显子在不同物种中剪接方式、调控元件、表达量、对应蛋白结构功能等方面的差异。可变剪接外显子的出现与进化不但提高了基因组的使用效率,也成为生物体获得新基因功能的重要途径。因此,研究可变剪接外显子的进化及其对基因调控、基因调控以及物(?)种进化的影响就成为了分子遗传学与进化生物学中一个有趣的研究方向。近年来,随着基因组计划的大规模开展、比较基因组学研究方法的日趋成熟以及高通量测序技术在科研中的广泛应用,使得利用比较基因组学和高通量测序大规模的开展可变剪接外显子进化研究成为可能。本文中,我们通过多种比较基因组学方法和人类、大鼠、小鼠多物种Solexa高通量测序、荧光定量PCR等实验手段在不同水平上对可变剪接外显子的进化规律和生物学意义进行了研究。首先,我们通过约100个自编perl程序脚本(12个核心程序详见第二章方法部分)及多种生物信息学软件首次构建了可变剪接外显子进化分析系统(Alternative Splicing Exon Evolution Analyzer, ASEEA), ASEEA涵盖了Ensembl数据库中2万多条人类基因、20多万个外显子,系统整合了外显子进化选择压蛋白结构域、剪接调控元件、重复序列以及基于多物种Solexa测序的外显子表达量等进化相关信息,为系统性研究可变剪接外显子进化规律提供了有力的分析工具。同时ASEEA也是首次使用高通量测序研究可变剪接外显子的相对表达量,其中部分程序对其它基于高通量测序的可变剪接研究也有一定参考价值。利用ASEEA,我们首次结合比较基因组学与mRNA高通量测序系统性总结了可变剪接外显子的进化规律。分析结果显示,可变剪接外显子的保守性低于组成型外显子,在可变剪接外显子中,古老外显子的进化选择压较大、表达量较高、重复序列包含率较低、与蛋白结构域重合的比例也较高,而年轻外显子则正好相反。该趋势体现了外显子进化中‘序列-表达-功能’的一致性,反映了可变剪接外显子从被引入转录本(exon recruiting)到获得功能(gain-of-function)进而固定在转录本中(fixation)的过程,而在此过程中重复序列的插入和正选择事件可能发挥了重要作用。我们还发现,可变剪接外显子对基因功能获得的贡献度在进化中不断上升。通过对比不同物种的Solexa数据我们观察到直系同源外显子表达量上存在明显的种问差异,提示可变剪接对高等生物的表型差异有重要贡献,而可变剪接外显子在物种进化中也存在相对表达量提高的趋势。此外,我们还首次对非盒式可变剪接外显子(特别是内含子保留型可变剪接,intron retention)的部分进化规律进行了分析。其次,我们利用ASEEA对Memorial Sloan-Kettering Cancer Center肿瘤相关基因数据库中的2006条肿瘤相关基因进行了可变剪接外显子进化研究。结果显示肿瘤相关基因中可变剪接外显子的进化符合可变剪接外显子进化的一般规律。同时,我们首次报道了肿瘤相关基因外显子在外显子年龄、进化选择压、蛋白结构域、剪接调控元件和表达量等方面的进化保守性倾向,说明肿瘤相关基因受到更严格的剪接调控,在引入新外显子时更具选择性。此外,我们还构建了基于MySQL的肿瘤相关基因可变剪接外显子进化数据片(OncoAS),并通过综合数据检索筛选出了部分可能发生重要进化事件的可变剪接外显子最后,根据OncoAS数据库的提示,我们选取了VEGFA和PPAR-gamma进行进一步研究。在VEGFA的研究中,我们在小鼠、家兔中首次报道了包含可变剪接外显子exon8b的抑制血管生成型VEGFA转录本,定量分析显示该转录本相对表达量在进化中持续上升,exon8b经历了从低等哺乳动物中低相对表达量外显子(minor form exon)到人类中高相对表达量外显子(major form exon)的转变并伴有剪接调控元件的强化。根据实验结果我们提出了VEGF基因调控机制形成的假说,提示exon8b与另一可变剪接外显子exon6的引入都是基因调控机制形成的重要步骤,对蛋自产物的细胞定位与生理功能的发挥具有重要意义。在PPAR-gamma的研究中,我们发现该基因中的四个可变剪接外显子处在从外显子招募到获得功能的不同进化阶段,其中exonB作为唯一一个编码的可变剪接外显子仍处在快速进化中,其在啮齿类中可能发生了正选择事件并获得了与脂肪贮存相关的功能。这些发现不仅在个体基因水平上进一步验证了我们总结的可变剪接外显子进化规律,也为研究人员未来对更多OncoAS筛选结果进行深入分析提供了参考的范例。