论文部分内容阅读
泛素–蛋白酶体系统(ubiquitin-proteasome system,UPS)是特异性降解蛋白的主要途径,参与了众多的细胞代谢过程。决定该系统中待降解蛋白特异性的是E3连接酶,其中研究较多的是SCF(SKP1–CUL1–F-box)复合体。该复合体中F-box蛋白是接头蛋白,负责特异性识别底物。F-box蛋白的共同特征是包含相对保守的F-box结构域。F-box基因的数目种间差别极大,从数十到上千。对F-box基因数目变化及其机制、结构和功能分化、选择压力模式的研究,利于深入了解基因组的进化,也为F-box蛋白的功能研究奠定基础。本论文主要研究了F-box基因在灵长总目和新杆状线虫属中的数目变化及其机制、结构和功能分化,以及E3和FBXO32基因分别在人和牛群体中的基因多样性。主要研究结果如下:第一部分:基于系统发育分析和自然选择检测等方法,研究了灵长总目进化过程中F-box基因的数目变化和所经历的选择压力模式。结果表明:(1)进化过程中,F-box基因发生了种系特异性地增加或丢失,致使研究所涉及的8个现存物种的F-box基因数目从66到81不等;(2)串联重复和半逆转录转座引起的F-box基因增加的方式均有发现,F-box结构域的突变是F-box基因数目减少的主要原因;(3)一些F-box蛋白识别底物的结构域内出现了正选择位点。结论:(1)在灵长总目的进化过程中F-box基因的扩张和缩减使其数目维持相对平衡,符合基因家族进化的生与死模型(birth-and-death model);(2)F-box蛋白发生了种系特异性的适应性进化。第二部分:基于比较基因组学和转录组测序数据分析等方法,研究了新杆状线虫属F-box基因数目的种间差异及变化机制,探讨了重复基因的基因结构分歧和功能分化。结果表明:(1)新杆状线虫属的5个物种间F-box基因数目差异极大,从数十到数千,且主要通过串联重复方式产生;(2)一些F-box基因重复产生的拷贝在F-box结构域发生了较大的变异;(3)导致重复基因的结构分化的机制主要有:外显子/内含子数目的增减、外显子化/假外显子化、外显子内序列的插入和缺失、编码区序列的突变和内含子序列的显著加长;(4)Caenorhabditis elegans(C.elegans)和Caenorhabditis briggsae(C.briggsae)的并系同源组内的F-box基因的时期特异性表达模式发生了分化。结论:(1)多种基因结构分化机制共同导致了F-box重复基因结构的分化;(2)C.elegans和C.briggsae的F-box基因通过不同的发育阶段特异性表达模式发生了功能分化。第三部分:采用千人基因组计划数据研究了多个群体的E3基因的单核苷酸多态性(single nucleotide polymorphism,SNP)和进化过程中受到的选择压力。结果表明:(1)非洲群体的E3基因的单核苷酸多态性显著高于其他大洲的群体;(2)E3的结构域受到了非常强的负选择压力,尤其是与靶蛋白结合的结构域。结论:E3基因与靶蛋白结合的结构域在整条序列中最为保守。第四部分:采用DNA测序和限制性酶切片段多样性的实验方法,研究了7个牛群体的FBXO32的单核苷酸多态性以及对确定的SNP与生长性状进行了关联分析。结果表明:(1)发现了4个新的SNP(ss411628932、ss411628934、ss411628935和ss411628936);(2)关联分析表明ss411628932和ss411628936位点均与南阳牛的24月龄的体斜长发育显著相关(P-value﹤0.05);(3)4个位点的SNP频率构建的系统发育树表明7个牛群体的亲缘关系远近与地理距离远近一致。结论:(1)FBXO32的外显子3和内含子10之间可能存在重组热点;(2)位点ss411628932和ss411628936可以作为牛育种的基因组标记;(3)地理隔离影响了群体间基因交流。综上所述,本论文综合利用比较基因组学、系统发育、选择压力、生物统计学等方法对灵长总目和新杆状线虫属进化过程中,F-box基因数目变化及机制、所受选择压力模式、重复基因结构和功能的分化做了系统的研究。另外,用实验生物学的方法研究了F-box基因家族成员之一的FBXO32的SNP以及其对功能的影响。本论文为F-box基因的起源、进化和功能的研究奠定了坚实基础,同时也为其它基因家族进化的研究提供了新思路。